推荐星级:
- 1
- 2
- 3
- 4
- 5
基于文本挖掘和复杂网络的中美电商专利比较研究
资料介绍
[目的/意义]中国和美国作为世界上最大的发展中国家和发达国家,在电商领域都取得了令人瞩目的成绩。通过对中美电商专利的比较能够深入了解中美在电商领域的技术发展和未来趋势。[方法/过程]提出一种基于文本挖掘和复杂网络的结合方法,包括中美电商专利关键词一致性判断,中美电商专利文档-词矩阵构造,中美电商专利余弦相似度关联矩阵构建,复杂网络分析等。[结果/结论]通过对701条美国电商专利和2 005条中国电商专利数据比较发现:a.美国电商专利研究领域聚焦性和技术性强,中国电商专利研究领域融合性和应用性强,中美电商专利研究有很强的互补性;b.中美电商专利有57个核心一致性关键词;c.从1 405 505对中美电商专利中寻找到380对高相似专利,可以为相关人员进行技术机会发现提供参考;d.复杂网络中以C388专利节点为例的中心网络,帮助其发现4个相关性社区。
部分文件列表
文件名 | 大小 |
基于文本挖掘和复杂网络的中美电商专利比较研究.pdf | 2M |
部分页面预览
(完整内容请下载后查看)情
报
杂
志
38
6
期
Vol.38 No.6
June 2019
第
卷
第
2019
6
月
年
JOURNAL OF INTELLIGENCE
基于文本挖掘和复杂网络的
*
中美电商专利比较研究
1,2
1
刘玉林
菅利荣
( 1.
211106;
241002)
南京航空航天大学经济与管理学院 南京
2.
安徽商贸职业技术学院经济贸易系 芜湖
[ / ] ,
目的 意义 中国和美国作为世界上最大的发展中国家和发达国家 在电商领域都取得了令人瞩目的成
摘
要
。
。[ / ]
方法 过程 提出一种基
绩
通过对中美电商专利的比较能够深入了解中美在电商领域的技术发展和未来趋势
-
,
于文本挖掘和复杂网络的结合方法 包括中美电商专利关键词一致性判断 中美电商专利文档 词矩阵构造 中美电
,
,
,
商专利余弦相似度关联矩阵构建 复杂网络分析等
。[ / ]
结果 结论 通过对
701
2 005
条美国电商专利和 条中国电商
: a. , ,
专利数据比较发现 美国电商专利研究领域聚焦性和技术性强 中国电商专利研究领域融合性和应用性强 中美
; b.
电商专利研究有很强的互补性 中美电商专利有
57
; c. 1 405 505
个核心一致性关键词 从 对中美电商专利中寻找
380
, ; d. C388
对高相似专利 可以为相关人员进行技术机会发现提供参考 复杂网络中以 专利节点为例的中心网
到
,
4
。
络 帮助其发现 个相关性社区
关键词 专利分析 文本挖掘 复杂网络 中美电商专利
G203
Python
文章编号
- - -
1002 1965( 2019) 06 0072 08
A
中图分类号
文献标识码
-
,2019,38( 6) : 72 79.
情报杂志
, .
引用格式 刘玉林 菅利荣 基于文本挖掘和复杂网络的中美电商专利比较研究
[J].
-
DOI 10.3969/j.issn.1002 1965.2019.06.012
-
A Comparative Study of Chinese and American E commerce Patents
Based on Text Mining and Complex Networks
1,2
1
Liu Yulin
Jian Lirong
( 1. College of Economics and Management,Nanjing University of Aeronautics and Astronautics,Nanjing 210016;
2.Department of Economics & Trade,Anhui Business College,Wuhu 241002)
-
Abstract [Purpose/Significance]Chinese and American have made remarkable achievements in the field of e commerce. At this time,
- -
by comparing Chinese and American e commerce patents,we can have an in depth understanding of the technological development and
-
future trend of Chinese and American e commerce.[Method/Process]Therefore,this study aims to propose a combined method of text
-
mining and complex network,including the consistency judgment of keywords in Chinese and American e commerce patents,the con-
-
struction of patent document word matrix,the construction of cosine similarity correlation matrix,and the analysis of complex network.
- -
[Result/Conclusion]By comparing the data of 701 American e commerce patents and 2 005 Chinese e commerce patents,it is found
- -
that: a.the research field of American e commerce patents is highly focused and technical,the research field of Chinese e commerce pa-
-
tents is highly integrated and applied,and the research of Chinese and American e commerce patents are highly complementary; a. there
-
are 57 core consistency keywords in Chinese and American e commerce patents; c.380 pairs of highly similar patents were found from 1
-
405 505 pairs of Chinese and American e commerce patents,which can provide reference for relevant personnel to find technical opportu-
nities; d. the C388 patent node was taken as an example of the central network in the complex network to help it find four relevant commu-
nities.
- -
: 2019 01 07
- -
: 2019 03 06
收稿日期
修回日期
: “
基金项目 国家自然科学基金项目 基于产学研跨组织知识集成网络的战略性新兴产业集群机制研究
”(
: 71573124) ;
研究成果之一 安徽
编号
“ ”(
高校优秀青年人才支持计划重点项目 基于文本挖掘和复杂网络算法的中美电商专利比较研究 编号
: gxyqZD2019101)
。
研究成果之一
- - -
( ORCID: 0000 0001 7371 8214) , ,1984
男
:
作者简介 刘玉林
, , , : ,
年生 博士研究生 讲师 研究方向 大数据分析与管理 复杂网络算法与应用
;
- - -
( ORCID: 0000 0002 0718 3052) , ,1968
女
, , , , : ,
年生 博士 教授 博士生导师 研究方向 科技创新网络管理 软计算方法
。
菅利荣
6
, :
刘玉林 等 基于文本挖掘和复杂网络的中美电商专利比较研究
第
期
·73·
-
Key words patent analysis text mining complex networks Chinese and American e commerce patents Python
,
掘的文献数量显著增加 被引用数据也呈现大幅度增
0
引
言
[5]
。Chiavetta
、
等学者确定了文献计量学 数据挖掘
、
长
[6]
20
、
网络分析 专利分析四大技术机会分析工具
。
,
当然
电商的快速崛起和发展是
21
世纪末伟大经济变
,
革之一 并且在
。
世纪不断产生深远的影响 中美两
。Ka-
等学者认为近年来许多基于专利的方法 主要
) ,
其中专利分析成为越来越受到学者欢迎的方式
,
国作为世界上最大的发展中国家和发达国家 在电商
jikawa
(
。
领域都取得了瞩目的成绩 美国率先提出电商概念并
基于文献计量分析或文本挖掘 很好的揭示了新兴
[7]
,
实践 随后亚马逊
、PayPal
。
等一批有代表性的公司或经
技术的发展方向
。 , ,
营方式涌现出来 当然 中国也是后起之秀 包括阿里
, :
最后 基于专利的技术机会分析被分类两类 基于
、 、 “
巴巴 京东 支付宝等代表性的公司或经营方式也 从
。Cho
专家知识的定性分析和基于数据的定量分析
等
, ”, 。
无到有 从弱到强 在世界范围内形成了影响力
、
学者认为使用专家知识的方法包括德尔菲调查 层次
、
电商实践领域的快速发展离不开知识 技术的发
,
分析法和情景规划等 可以支持一般领域的技术机会
[8]
、 。 ,
展 应用和转移 当然 电商实践领域的快速发展也促
。
Lee
但 等学者说明虽然专家的判断仍然重
发现
。 ,
进知识和技术的快速革新 因此 对电商未来发展的
, ,
要 但研究表明随着专利数据增加 专家并不总是正确
。
讨论和把握自然离不开对知识和技术趋势的研究
在
。Yoon
,
认为专家方法不仅耗时 而且在分析和结果
的
[9]
,
电商知识和技术中 最有代表性的就是专利
。
在
21
世
。
的判断中个人主观因素明显
基于数据的定量分析主要分为基于网络的专利分
, ,
纪初期 对电商专利的研究 尤其是对中美电商专利的
, 、
特征比较研究 能够把握知识和技术发展的历史 现状
。
析和基于关键词的专利分析 基于网络的专利分析由
, ,
和前沿 更好的判断电商未来的发展趋势 有利于国家
, ,
专利引文网络构成 其中专利文件视为节点 引用情况
、 、
和企业在技术机会发掘 研发管理投资 技术融合等方
。
被定为连接 例如
Wartburg
等学者通过创建一个被
。
面的政策决策制定
,
本研究的总体结构如下 第 节回顾了现有文献
;
引专利网络来分析技术集群和专利之间的相互关系
:
2
,
基于关键词的专利分析依托文本挖掘技术 提取专利
; 3
讨论了他们的贡献和不足 第 节简要的解释了研究
,
文档关 键 词 并 进 一 步 分 析 专 利 类 型 或 形 态 学 特
[10]
; 4 ; , 5
方法 第 节是数据分析 最后 在第 结论总结了全
。
Park
,
通过文本挖掘提取专利文档关键字
征
例如
, 。
文 并说明本研究的贡献与不足之处 需要说明的是
:
,
并构造为向量和形态学矩阵 分析了专利主要技术上
[11]
本文中中国电商专利是指在中国境内申请并经中国政
。
,
关键字的组合
合技术也不断被探索 例如
建关键词网络来提供分析专利的技术开发效率 尤其
当然 同时基于网络和关键词的融
,
府部门授权的电商领域专利 美国电商专利是指在美
,
Jinho Choi
等学者通过构
,
国境内申请并经美国政府部门授权的电商领域专利
中美电商专利比较具体指分别经过中国政府和美国政
,
LED
,
是将该方法对
和无线专利两个案例的实证分析
[12]
。
府专门部门授权的专利特征比较
。
说明同时基于网络和关键词的优势
,
综上所述 现有研究很好的进行了专利分析领域
1
文献综述
[13]
,
,
的探索
方法的改进
的专利特征比较和相似度识别进行深入分析 尤其是
基于文本挖掘和复杂网络结合方法的研究还有待于进
既有专利发展方向的探讨 也有专利分析
[14]
通过专利发现新的技术机会一直是学术界和实践
。
但不足之处在于没有对国与国之间
。 ,
的重要问题 首先 部分学者对技术机会定义进行了
,
。
讨论 例如
Olsson
将技术机会定义为一般或特定领
[1]
。Klevorick
域内技术进步的潜力
等学者认为技术
。 ,
一步挖掘 因此 本研究进行了中美电商发明专利比
,
机会包括一系列技术进步的可能性 而技术进步可以
,
: a.
较研究 创新之处包括
对中美专利特征比较和相
似度进行分析 有利于中美两国间社会技术的进步和
; b.
[2]
。Yoon
从企业内外的知识来源中获取
等学者将技
,
,
术机会定义为对技术进步的承诺 或其在特定领域或
专利的转化
进一步丰富了文本挖掘和复杂网络技
[3]
。Noh
跨行业领域中推动技术进步的潜力
等学者提
; c.
术在专利分析中的应用 目前还没有对电商专利领
、 、
出了包括技术空缺 技术融合 新兴技术和技术承诺等
,
域的案例研究或实证分析 这是目前社会电商实践和
[4]
4
。
。
种技术机会类型
行业发展的迫切需求
,
其次 学术界对技术机会的分析方法进行了探索
。
2
基于文本挖掘和复杂网络的专利比较方法
Madani
等学者认为技术机会分析可以被视为技术挖
(
掘 即
tech mining) ,
并且自
2005
,
年以来 关于技术挖
2.1
整体研究框架 将基于文本挖掘和复杂网络
全部评论(0)