学术服务内容

在线编辑 学术顾问

咨询率高的期刊

推荐论文

基于异构数据的颠覆性技术识别研究以智能制造装备领域为例

时间:2022年07月02日 所属分类:推荐论文 点击次数:

摘 要: [目的/意义] 颠覆性技术研发作为国家战略,如何准确识别颠覆性技术,对于国家和企业把握技术先机,抢占技术制高点意义重大。 [方法/过程] 本文结合专利文献数据,利用 LDA 主题模型实现数据降维,提取技术主题,从技术主题成长性、融合性、创新性、突

  摘 要: [目的/意义] 颠覆性技术研发作为国家战略,如何准确识别颠覆性技术,对于国家和企业把握技术先机,抢占技术制高点意义重大。 [方法/过程] 本文结合专利文献数据,利用 LDA 主题模型实现数据降维,提取技术主题,从技术主题成长性、融合性、创新性、突破性 4 个特征识别候选颠覆性技术; 在此基础上,结合网页新闻数据,测算候选颠覆性技术主题与网页新闻数据主题之间的匹配度,分析技术的市场属性,准确识别颠覆性技术。[结果/结论] 本文以智能制造装备领域为例,通过实证研究得到 “智能数字控制”及 “智能数据采集系统”是智能制造装备领域的颠覆性技术。

  关键词: 异构数据; 文本挖掘; 颠覆性技术; 技术识别

技术创新

  技术创新是经济发展第一动力,而颠覆性技术作为技术创新的重要内容,其对以往的技术和市场具有较强的破坏力。颠覆性技术是打破原有技术生命周期,构建新的技术轨道,以意想不到的方式取代现有主流技术的技术[1],它能够实现社会技术体系的跃迁,改变技术产品性能,变革原有技术性能标准,对于军事、科技、产业等具有变革性的意义。世界各国普遍重视颠覆性技术研发,并设计专门的组织或研发计划,旨在促进颠覆性技术发展,例如: 美国国防高级研究技术局( DARPA) 、日本的颠覆性技术创新计划( ImPACT) 。中国也高度关注颠覆性技术研发,中国的 《国家创新驱动发展战略纲要》《科技部办公厅关于开展颠覆性技术研发方向建议征集工作的通知》等文件明确提出发展颠覆性技术,将颠覆性技术摆在国家战略位置。而颠覆性技术发展具有高度不确定性,研发过程漫长,如何在复杂的技术环境中及早准确识别颠覆性技术,对于加快颠覆性技术研发,掌握国际竞争发展先机具有重要意义。

  1 相关工作概述

  对于如何识别颠覆性技术,国内外学者已经取得丰富研究成果,其中专家经验、专利数据、科技论文、市场用户数据、政策法规是颠覆性技术识别常用的数据源。早期主要采用专家经验及知识识别颠覆性技术,而依靠专家经验的识别方法包含: 调查问卷法[2-3]、专家访谈[4]、理论分析[5]、技术路线图[6]等。专家知识和经验的利用,能够准确识别特定领域颠覆性技术,但专家资源稀缺,且应用范围较窄,难以满足颠覆性技术识别需求。为解决该问题,学者采用专利文献数据及科技论文识别颠覆性技术。

  专利文献包含大量技术信息,学者综合专利申请数量[7]、专利引用量[8]、科学关联度[9]、专利权利要求数[9]、IPC 数量[10]、专利发展路径[11]、专利引用知识突变[12]、专利引文相似度[13]等专利外部属性识别颠覆性技术,然而基于专利外部属性的颠覆性技术识别方法,难以充分挖掘专利文献信息,技术宽泛,细粒度不足,并且专利引用具有滞后性,无法及时识别颠覆性技术。为解决以上问题,学者深入专利内部,将文本挖掘及深度学习方法应用于颠覆性技术识别,以技术属性集相似度[14]、技术主题突变[15-16]挖掘专利文献内部信息,以此完成颠覆性技术识别。目前,基于专利内部信息识别颠覆性技术的研究还比较少。

  科技论文同样包含技术信息,部分学者将科技论文用于颠覆性技术识别,结合科技论文数量变化[11]、科技论文被引量[17]、科技论文关键词网络[18]、知识主题突变[19]等指标识别潜在颠覆性技术。除了从 “技术属性”层面识别颠覆性技术,也有学者基于市场用户需求数据、商业报告数据,分析技术功能变化[20]、技术发展轨迹[21]、技术成熟度[22]、技术市场潜力[23]、消费者偏好[24]、产品功能变化[21]、客户满意度[25],进而探究技术对于市场的颠覆程度,以此完成颠覆性技术识别。该类颠覆性技术识别方法,考虑了市场及用户数据,更贴近市场需求,但该识别方法对技术本身挖掘不充分,忽视技术知识结构,识别结果较为片面。为了提升颠覆性技术识别准确性及全面性,本研究基于专利文献,引入文本挖掘技术,获取技术知识结构信息,结合颠覆性技术特征,从技术属性层面识别候选颠覆性技术,并结合网页新闻数据,探究候选颠覆性技术的市场影响,分析技术的市场属性,进而确定颠覆性技术。颠覆性技术整个识别过程,综合专利文献及网页新闻数据,从技术属性及市场属性两个角度识别颠覆性技术,能够提高识别结果的准确性及全面性。

  2 颠覆性技术特征分析

  颠覆性技术源于技术融合或创新活动中产生的重大技术范式变革,实现技术性能突破,带来全新的功能属性,满足主流客户需求,取代现有主流技术。本文将其特征归纳为 4 个方面。

  1) 成长性: 颠覆性技术沿着 “利基市场—中间市场—主流市场”的路径演进[26],颠覆性技术早期在主流市场需求的性能维度上比主流技术产品低劣[1],只能服务利基市场或边缘市场,但通过后期的技术改进与创新,技术产品性能不断提升,具备高性能、低成本优势[27],最终成长为市场主流技术。因此,技术成长性是颠覆性技术的重要特征之一。2) 融合性: 颠覆性技术可以是技术融合的产物[28],未来大部分颠覆性技术将来源于不同领域的技术融合[29]。跨越不同知识结构或不相关领域的技术不断交叉、嵌入,组合新颖的知识元素,打破以往知识结构对技术轨道的约束[30],为颠覆性技术的产生奠定基础。因此,融合性是其重要特征[10]。

  3) 创新性: 颠覆性技术不是对现有技术的进一步改进,而是更大程度的创新[31],该技术可以提供全新功能、不连续的技术标准以及新的所有制形式,同时可以改变市场标准和消费者期望[32],实现产品或服务技术特征以及功能属性的革新。因此,创新性是颠覆性技术显著特征之一。4) 突破性: 颠覆性技术可以由科学知识突变或科学原理变化产生,也可以由技术集成创新产生,该类技术具有重大的突破性[2],能够替代原有的技术,实现技术性能突破,改变因技术研发局限性造成的产业市场落后状况,满足主流市场技术需求,实现市场突破[33]。因此,突破性是颠覆性技术所具有的特征之一。

  3 颠覆性技术识别框架

  3. 1 异构数据收集及预处理

  异构数据是指来源和结构不同的数据,相对于单一数据集,异构数据使不同数据特征融合成为可能。颠覆性技术识别过程中,为提高颠覆性技术识别准确性及全面性,本文综合使用专利文献及网页新闻两种异构数据。专利文献记录技术创新、工艺优化,蕴含丰富的技术知识结构信息; 网络新闻数据是市场不同主体对技术的客观描述,反映市场主体对技术的态度、应用以及评述,可用于分析技术的市场属性[34]。因此,本文将专利文献及网页新闻两种异构数据作为颠覆性技术识别的数据源。

  1) 专利数据收集及预处理德温特数据库作为世界知名专利数据库,已经收集多个国家和地区的专利文献,专利信息覆盖全面,且数据库不断更新,为技术情报分析提供了可能。因此,本文选择德温特数据库收集专利文献数据。为全面检索专利文献,本文结合关键词及 IPC分类号,制定检索表达式,收集专利文献数据。NLTK 术语库是著名的自然语言处理库,具有词性分类、词干提取、词性标记等功能,为 50 多种语料库和词汇资源提供使用界面[35],为此,本文将其引入专利数据处理,实现词干提取及词性还原,并结合停用词表,剔除无关词语,保证数据的有效性。

  2) 网页新闻数据收集及预处理网页新闻数据量庞大,人工收集数据工作量巨大,且难以全面获取新闻数据。为此,本文采用网络爬虫技术实现网页新闻数据收集。而 维 特 比( Viterbi) 算法通过寻找动态规划最大概率路径,找出词频的最大切分组合,具有良好的分词效果[36],对此,本文将其应用于网页新闻数据分词。

  3. 2 文本数据聚类模块LDA( Latent Dirichlet Allocation)

  主题模型作为典型无监督学习,能够挖掘文档隐藏语义信息,处理海量文本文档,降低无效信息影响,实现专利文献及网页新闻数据的高效聚类,因此,LDA 模型作为本文主题聚类的首选。LDA 主题模型最早由Blei D M 等提出[37],其假设每篇文档由特定概率的主题组成,而主题又由特定概率的特征词组成,形成 “文档—主题—特征词”的三层贝叶斯概率模型。LDA 模型提取效果直接由主题数量决定,为精准确定主题参数,本文结合困惑度( perplexity) 及“肘形”理论确定模型参数。困惑度表示所训练模型中特定文档属于哪个主题的不确定性[37],其中困惑度计算如式 ( 1) ~ ( 3) 所示; 而 “肘形”是困惑度曲线的拐点,该拐点与上一节点差值最大,而与后一节点的差值最小,而 “肘形”对应的主题数为模型的最优主题数[38]。

  3. 3 颠覆性技术主题识别模块

  根据颠覆性技术的成长性、融合性、创新性以及突破性,本文采用专利申请量以及技术强度判断技术成长性; 采用技术主题 IPC 分类号、接近中心性判断技术融合性; 测度技术主题有效规模及约束度探究技术创新性; 基于技术异常检测判断技术的突破性,结合以上 4 个维度从技术属性层面识别候选颠覆性技术,并结合网页新闻数据,探究候选颠覆性技术主题的市场属性,最终完成颠覆性技术识别。

  1) 技术成长性及融合性测度“成长性”是指颠覆性技术能够逐步替代原有技术,变革技术知识结构,最终成为市场主流技术。为体现技术成长性,本文采用专利申请数量以及技术主题强度变化测度技术成长性。技术主题强度能够反映各时期内技术的热门度,技术主题强度越高表示技术主题影响力越强。

  “创新性”是颠覆性技术基本属性之一。颠覆性技术能够提供新的产品或技术功能,改变原有技术范式,具备较强创新性。技术主题共现网络中结构洞占据者能够获取非重复异质信息,技术创新可能性较高,因此,本文采用结构洞指标测度技术主题的创新性。

  4 智能制造装备领域颠覆性技术识别案例

  制造业是国民经济的主体,是立国之本、兴国之器。制造系统的智能化是制造业新的发展方向,制约国家竞争力的提升,是各国关注的焦点。智能制造装备领域具有科技创新能力强、产业关联度高等特征,极易产生颠覆性技术。因此,本文选择智能制造装备领域作为研究对象,利用专利文献以及网页新闻数据,识别智能制造装备领域颠覆性技术。

  LDA 模型的主题参数直接决定智能制造装备领域技术主题提取的准确性,为保障智能制造装备领域专利文献及网页新闻数据聚类效果,本研究综合困惑度及肘形确定 LDA 模型主题参数。其中,专利文献以及网页新闻 LDA 主题模型困惑度及肘形。综合不同主题数下模型困惑度及肘形,得到智能制造装备领域专利文献 LDA 模型最优主题数为 87,而智能制造装备领域网页新闻数据 LDA 模型最优主题数为 72。其中,专利文献聚类结果中两个主题由数字构成,本研究将其剔除,剩余 85 个技术主题; 由智能制造装备领域网页新闻数据 LDA 模型得到 72 个主题,其中与智能制造装备领域相关的主题共 28 个,剩余 44 个主题与智能制造装备领域关联性不强,将其剔除。每篇文档由一定概率的主题组成,为准确提取文档信息,本文借鉴 Mann G S 等的研究[47],认为若主题分布概率大于 0. 1,则认为文档属于该主题,进而删除文档中主题分布概率低于 0. 1 的主题。

  颠覆性技术实现技术性能突破,不断发展,最终成为主流技术,该发展过程中技术创新主体逐渐多样化,专利申请数量不断增加。因此,本研究结合专利文献的时间属性,统计技术主题专利申请数量及技术主题强度,绘制不同时间段各技术主题专利申请数量及主题强度变化。

  通过构建不同年份下技术主题共现网络,得到技术主题接近中心性变化趋势。由于 2000 年前各技术主题共现强度较弱,接近中心性不显著,因此仅展示 2000 年后技术主题的接近中心性变化趋势。为保持数据一致性,下文同样仅展示2000 年后智能制造装备领域的数据。此外,本文统计不同技术主题内部 IPC 分类号,多维度分析技术主题融合性。

  通过智能制造装备领域技术主题异常检测可知,Topic21( 智能数字控制) 、Topic84( 智能数据采集系统) 两个技术主题与其他类型技术主题距离较远,属于智能制造装备领域异常点,具有实现技术突破的可能性。因此,本文认为 “智能数字控制”以及 “智能数据采集系统”两项技术是智能制造装备领域的候选颠覆性技术。 网页新闻数据主题命名网页新闻数据 LDA 主题模型共提取 72 个主题,删除无关主题及低强度主题 44 个,剩余 28 个主题与智能制造装备领域相关。根据智能制造装备网页新闻数据 LDA 主题模型特征词及概率分布,对提取的智能制造装备领域网页新闻数据主题进行命名。

  基于以上研究结果,本文认为 “智能数字控制”及 “智能数据采集系统”两项技术是智能制造装备领域的颠覆性技术。“智能数字控制”与传统的控制技术不同,智能控制技术更强调设备的自动化和智能化,融合机械技术、计算机技术以及控制技术,改变了传统机械制造模式,实现高效率制动控制; 此外,智能数字控制技术显著提升产品质量及生产精度,弥补机械精细化加工领域传统机械制造模式 “粗放”缺点。“智能数据采集系统”能够完成海量规模数据的采集,有效处理智能制造各环节数据,将数据转化为知识,有利于问题的分析,避免问题的重复发生。由于智能数据采集系统所具有的高效便捷特性以及良好的可扩展性,智能数据采集系统已经得到越来越多国内企业及客户的支持,成为多个企业研究和开发的重点。

  5 效果评估

  为评估论文提出方法的有效性,本文采用基于离群专利的颠覆性技术识别方法[9],识别智能制造装备领域颠覆性技术,并对比结果。由于篇幅限制,本文未展示识别过程。根据该方法,筛选得到智能制造装备领域离群专利7 745条,涵盖 15 种技术组合,并综合科学关联度、技术影响潜力等多个指标评估技术组合,运用孔多塞投票法识别颠覆性技术。最终得到智能数字控制、电机控制与连接技术、无线传感器网络芯片技术、智能信息存储、智能数据采集系统属于智能制造装备领域的颠覆性技术。该方法最终的识别结果包含本研究的识别结果,识别结果相对宽泛,主要原因在于当技术组合得分相近时,该方法主观性较强,且该方法尚未考虑技术的市场属性,影响识别结果的准确性。而本文提出的方法,综合专利文献及网页新闻两种异构数据,识别过程客观,考虑技术的市场属性,能显著提升颠覆性技术识别的准确性。

  6 研究结论

  本文利用专利文献及网页新闻数据,提取不同类型的主题,从成长性、突破性、创新性及融合性4 个维度识别候选颠覆性技术主题,并结合网页新闻数据,探究候选颠覆性技术的市场属性,最终完成颠覆性技术识别。本研究结合不同数据源,利用文本挖掘方法准确地识别颠覆性技术,对于加快颠覆性技术研发具有重要的参考价值。智能制造装备领域颠覆性技术识别案例中,利用 LDA 模型从专利文献中提取 87 个技术主题,其中 “智能数字控制”以及 “智能数据采集系统”两个技术主题符合颠覆性技术成长性、融合性、创新性以及突破性特征; 结合网页新闻数据主题,得到“智能数字控制” “智能数据采集系统”与多个网页新闻主题匹配,两种技术已被市场所接受,技术影响力较强,能够改变原有生产方式,属于智能制造装备领域颠覆性技术。案例研究结合专利文献及网页新闻两种异构数据识别颠覆性技术,研究结论清晰明确,说明综合专利数据以及网页新闻数据能够有效识别颠覆性技术。但限于篇幅,本研究对智能制造装备领域网页新闻数据挖掘不充分,技术对市场的影响体现不足。未来研究将结合深度学习模型,深入分析技术与市场之间的关系,充分体现技术的市场属性。

  参 考 文 献

  [1] Bower J L,Christensen C M. Disruptive Technologies: Catchingthe Wave [J]. The Journal of Product Innovation Management,1995,28 ( 2) : 155.

  [2] 孙永福,王礼恒,孙棕檀,等. 引发产业变革的颠覆性技术内涵与遴选研究 [J]. 中国工程科学,2017,19 ( 5) : 9-16.

  [3] Collins R W,Hevner A R,Linger R C. Evaluating a DisruptiveInnovation: Function Extraction Technology in Software Development [C] / /2011 44th Hawaii International Conference on SystemSciences,2011.

  [4] Hang C C,Chen J,Yu D. An Assessment Framework for Disruptive Innovation [J]. IEEE Engineering Management Review,2013,41 ( 4) : 109-118.

  [5] Sainio L M,Puumalainen K. Evaluating Technology Disruptivenessin a Strategic Corporate Context: A Case Study [J]. Technological Forecasting and Social Change,2007,74 ( 8) : 1315-1333.

  [6] Zhang Y,Robinson D,Porter A L,et al. Technology Roadmappingfor Competitive Technical Intelligence [J]. Technological Forecastingand Social Change,2016,110 ( 9) : 175-186.

  [7] Buchanan B,Corken R. A Toolkit for the Systematic Analysis ofPatent Data to Assess a Potentially Disruptive Technology [J]. Intellectual Property Office United Kingdom,2010.

  选自期刊《现代情报》2022 年 7 月

  作者信息:马永红 孔令凯* 林超然 杨晓萌 倪惠莉( 哈尔滨工程大学经济管理学院,黑龙江 哈尔滨 150001)