学术咨询

让论文发表更省时、省事、省心

基于K-means与技术生命周期的技术预见方法研究以水体净化技术为例

时间:2022年01月25日 分类:经济论文 次数:

摘要:预见水体净化技术发展趋势有助于实现美丽中国建设目标。已有技术预见方法缺乏定量客观依据,相关评判指标也不够全面。从Innography数据库检索2008-2019年发布的3552个污水处理技术专利,运用多维标度分析和K均值聚类法,基于专利静态指标分析专利技术发展潜力,采用技

  摘要:预见水体净化技术发展趋势有助于实现“美丽中国”建设目标。已有技术预见方法缺乏定量客观依据,相关评判指标也不够全面。从Innography数据库检索2008-2019年发布的3552个污水处理技术专利,运用多维标度分析和K均值聚类法,基于专利静态指标分析专利技术发展潜力,采用技术生命周期分析法从动态视角判断每类技术的发展前景。研究发现:①污水与污染物双重回收可持续性技术在多个静态评价指标方面均优于其它技术,且处于从引入期到发展期的过渡阶段,具有广阔的发展空间;②以去除特定污染物为目标的功能单一技术已被淘汰,市场开始应用污水处理原理不同的多种技术联合处理方式。据此,提出企业应选择污染物回收率高、二次污染物排放少、整体“净效益”为正的污水处理技术,并采取新旧技术联合处理方式降低企业采用新技术的转换成本。

  关键词:K均值聚类;技术生命周期;技术预见;技术专利;水体净化

水体净化技术

  0引言

  自改革开放以来,中国沿着工业化、城市化和农业现代化轨道迅猛发展,虽在较短时间内实现了经济大幅增长,但也导致大量污染物排放到水生态系统中。为遏制水环境的日益恶化,中国自2005年以来采取了诸多措施,如城市污水处理和污染物排放总量控制目标的制定、“水十条”的颁布、“美丽中国”目标的提出等。随着污水处理需求的增长,处理过程本身也会消耗大量化学试剂、能源和淡水资源,还会产生温室气体和污泥废物,这种负面效应逐渐显现[1]。因此,加强污水处理技术研发升级,降低能源消耗和环境二次污染是企业面临的新课题。企业选择正确的污水处理技术,准确预见水体净化技术发展方向是当务之急。

  目前,主流技术预见方法包括:①定性分析法,如德尔菲法和情景分析法;②定量分析法,由于定性分析法需要投入大量时间和成本,结论容易受到认知偏差的影响,且无法客观衡量专家判断的准确性[2-4],因此近年来定量分析法应用越来越广泛。张振刚和罗泰晔[5]采用专利知识元素网络(IPC分类号,InternationalPatentClassification)对网络进行K均值聚类分析,并根据每一个聚类中关键词出现频率挖掘各类技术的发展潜力。

  该方法虽然考虑了专利内部知识属性,但缺乏基于外部因素(专利被引用量)的专利质量评价信息,导致结果可能存在偏差;Kim&Bae[6]根据专利CPC分类信息,采用K均值聚类法预测健康护理行业未来技术。相较于IPC,CPC对技术的分类虽然更加详细,也更有利于把握专利知识要素,但未对数据进行孤立点分析,有可能导致孤立点成为初始聚类点,从而产生系统误差。

  另外,Kim用来评价聚类结果的指标仅限于专利被引用量、家族规模和权利要求项数,评价指标不够全面,未对专利被引用量规定统一观测时间,忽略了生存时间不同的专利。 综上所述,以往学者大多使用专利静态指标进行技术预见分析,存在评价指标不全面、度量方式不合理等问题,且依据静态指标分析只能判断最具前景的一类技术,无法分析现有技术发展阶段,更无法判断现有技术是否已经进入衰退期。

  为避免系统误差,本文从技术生命周期动态视角分析现有技术所处发展阶段并提出技术综合利用方案。本研究从Innography数据库中获得2008-2019年发布的3552个水体净化技术专利数据,首先,依据多维标度分析和K均值聚类法对专利内在知识属性进行分类(CPC);其次,利用静态指标(专利内部属性、外部评价和总体评价)评价所得专利聚类的技术前景;再次,通过技术生命周期分析判断每类技术所处发展阶段,从而推测技术未来发展趋势;最后,使用2016-2019年发布的专利数据验证上述研究结果的准确性。本文不仅考虑专利所包含的技术知识,还从专利新颖性、市场接受程度和技术发展阶段出发,依据多个指标和动静态相结合的方法判断新技术发展潜力,以期提高技术预见方法的可靠性,并为企业未来水体净化技术选择和开发提供参考依据。

  1数据来源与研究过程

  1.1数据收集与筛选

  本文数据来源于Innography数据库,该数据库收录了在美国专利商标局(USPTO)和欧洲专利局(EPO)等多个专利局注册的专利,专利持有人来自100多个国家,专利总数达到1亿多个,数据内容包括专利发布时间、被引用量等20多类信息,专利数据量大、信息内容全,且包含单独的专利强度指标(专利指标取值范围为0~10,数值越大说明专利价值越高),有助于研究者选择特定应用领域的全面样本。

  本文从关键词与CPC分类号两个方面设定专利检索式,检索在专利标题、内容摘要、权利要求中含有wastewater、sewage等关键词的专利。水体净化行业CPC分类号大多分布在C02和Y02类别中,少数分布在B部中。需要说明的是,本研究使用专利CPC分类号而非IPC分类号分析专利所属知识。

  CPC分类号自2013年1月1日起生效,是由欧洲专利局和美国专利商标局共同开发的专利分类制度。CPC拥有超过25万个技术类别,远大于IPC的7万个类别,技术分类更详细[7],更适用于技术信息分析和聚类研究。在提取初步样本后,删除同族专利,筛选出专利类型为发明专利且专利强度大于5的专利,将专利发布时间限定为2008年1月1日至2019年12月31日,最终得到3552个专利。

  1.2数据分析过程

  本文将样本专利分为两组:第一组为预测组,共包含2148个专利,即观测期前8年发布的专利,用于预见未来最有潜力的技术;第二组为检验组,包含1404个专利,即观测期后4年发布的专利,用于检验预测组结果是否准确。若潜力技术所占比例在检验组中呈增长趋势,说明预测结果比较可靠。

  对于上述两组样本,本研究首先使用多维标度分析法将具有高维特征的数据(专利CPC分类)降至二维,以降低K均值聚类分析误差;其次,对二维数据进行K均值聚类分析,将距离相近的专利聚为一类,依据每类中出现频数位于前十的CPC分类定义专利技术名称;再次,分析预测组中每类专利的内部属性、外部评价和总体评价8项静态指标,得到有前景的技术,根据专利技术生命周期判断每类技术所处发展阶段及发展前景;最后,依据预测技术在检验组中所占比例检验预测结果的准确性。

  2水体净化专利多维标度分析

  多维标度分析(Multidimensionalscaling,MDS)是将高维数据映射到低维空间,并保持各观测样本原始关系的统计方法[8],能够将专利数据的多个维度降至二维,并避免K均值聚类分析所导致的原始样本关系失真问题。本研究使用MDS法,将专利多维CPC分类映射到二维空间上,根据专利CPC分类计算专利之间的相关系数,得到专利相关系数矩阵。

  考虑到某一专利可能属于多个CPC类别,故先将专利与CPC的对应关系描述为一个不对称矩阵PCM(patent-cpcmatrix),。PCM的每一行代表一个专利,每一列代表一个CPC。若某专利属于某个CPC则将对应矩阵元素赋值为1,否则赋值为0。然后,构建对称PPM矩阵(patent-patentmatrix),PPM矩阵中的元素值等于专利间的Pearson相关系数。

  3水体净化专利K均值聚类

  K均值聚类法(K-means)依据专利距离将专利划分为K个类别,每个类别的中心位置根据类别中所有观测值的均值得出。K-means聚类分析法对噪声数据较为敏感,少数孤立点数据有可能导致聚类结果失真。另外,该方法需要根据研究者的经验确定聚类数目,容易受主观因素影响。为克服这两个缺陷,本研究首先识别并剔除孤立点以消除噪声因素的影响,然后通过轮廓系数确定最佳聚类数,再进行K-means聚类分析,K-means聚类所得结果即是当前污水处理技术的主要类别。

  3.1孤立专利点识别

  孤立点是指不符合数据分布模型的专利,往往远离数据密集区域。本研究根据专利点标准分数z识别专利是否为孤立点[9],标准分数计算方法如下:若xim为专利xi在第m个维度上的值,计算结果表明,预测组孤立点专利有176个,检验组孤立点专利有116个。本文在聚类分析前首先剔除这些孤立点专利,待聚类结束后再依据孤立点到聚类中心的欧氏距离,将孤立点加入最近类别中。

  3.2聚类数目确定

  本研究采用轮廓系数确定最佳聚类数目。轮廓系数si的取值范围为[-1,1],si越接近1,说明专利i的聚类结果越理想;si越接近-1,说明专利i被分配到其它类别中的可能性越大。

  整体聚类轮廓系数为单个专利轮廓系数的平均值,本研究在计算轮廓系数时以迭代30次为基本条件,以避免出现局部最优值。其中,在预测组中,K=3、K=4的轮廓系数分别为0.8574、0.8609,二者相差0.41%,聚类数均较好。通过进一步分析每类专利的CPC分类发现,当专利被分为4类时,第一类中有90.91%(20/22)的分类号出现在第二类,两类之间的知识重合度较大,因此应合并为一类,所以将预测组聚类系数确定为3类。

  在检验组中,K=2、K=3、K=4的轮廓系数分别为0.8369、0.8614、0.8456,聚类数均较好。聚类分析结果显示,当专利被聚为3类时,第二类中有85.71%(36/42)的CPC分类号出现在第三类;当专利被聚为4类时,第三类中所有CPC分类均出现在第一类。因此,为降低聚类结果重合度,本研究将检验组聚类数确定为两类。

  3.3水体净化专利聚类

  K-means检验步骤如下:第一步,在数据中随机选取k个专利作为初始聚类中心。第二步,将所有专利分配到距离聚类中心最近的类别中。第三步,将每类专利二维坐标的平均值作为下一次迭代的聚类中心。重复上述步骤2、3,若聚类结果不再更改,则停止迭代。在得到聚类结果后,本文将先前剔除的孤立点专利加入与其距离最近的类别中。

  展示了孤立点与每个聚类中心的欧式距离,Dim1和Dim2为专利通过MDS降维后得到的二维坐标值。可以看出,预测组孤立点专利与第三类聚类中心最近(9.644),故将其放入第三类聚类中;检验组孤立点专利与b类聚类中心最近(7.728),因而将其归入b类聚类中。最终,预测组数据被聚为3类,专利数量分别为234(10.89%)、1574(73.28%)、340(15.83%);检验组数据被聚为两类,专利数量分别为1065(75.85%)、339(24.15%)。

  3.4专利类别技术名称定义

  在定义技术名称之前,笔者通过与水体净化领域的专家讨论,删除较为基础、普遍存在且易于实施的技术分类(CPC),如调节污水的PH值等,然后统计每类专利中频数位于前10的CPC技术分类,最后根据前10位CPC概括出各类专利所代表的技术名称。

  本研究根据污水处理污染物对象、技术原理、处理结果定义每一类技术。其中,预测组第一类为去除特定污染物的技术,如去除废水中油、有害化合物的技术。该类技术未出现在检验组中,表明其在未来4年将被淘汰;第二类为可持续性技术,主要指废水污染物再利用、减少污水二次污染和新能源使用的技术,如树脂型离子交换剂、太阳能水处理系统、生物处理技术(微生物、厌氧技术)等。

  该类技术同时出现在预测组(类2)和检验组(类a)中,CPC重合度高达60%,说明其在未来4年仍是主流技术;第三类为物理化学技术,如综合运用物理和化学方法净化废水的浮选技术、反渗透技术、臭氧氧化技术,该类技术同时出现在预测组(类3)和检验组(类b)中,表明其在未来4年仍是企业使用的主要技术。对于可持续性技术和物理化学技术的发展潜力,需要进一步通过静态指标和动态技术生命周期进行分析。

  4水体净化技术前景评价

  4.1静态指标分析

  本研究依据专利内部属性(专利引用量、家族规模、独立权利要求项数和发明人数)、外部评价(专利被引用量、诉讼量和知识产权成本)和总体评价(专利强度)的8个静态指标分析每类技术的发展潜力。技术潜力越大,专利申请质量越高,越容易成为未来主流技术。

  4.1.1内部属性指标

  (1)专利引用量。专利引用量是指引用其它专利的数量。专利引用数量越多,技术基础越扎实,与其它技术兼容的可能性越大,专利也就越有可能成为主流技术[10]。(2)专利家族规模。专利家族是指同一专利在不同国家、不同时间申请专利的集合。由于专利在每个申请国家都需要付出维护成本,因此企业更倾向于为高质量专利付出更多维护费用。专利家族规模越大,专利技术价值和经济价值也就越高[11]。

  4.1.2外部评价指标

  (1)专利被引用量。专利被引用量越多意味着技术发明所作的贡献越大,因而越具有经济价值和技术价值[15-16]。为对发布时间不同的专利进行统一比较,本研究使用专利发布后4年内的被引用量度量该指标[17-18]。(2)专利诉讼量。企业更愿意对高质量专利发起诉讼[14],因而诉讼量越多意味着专利价值越大,专利市场占有率越高,也就越有可能成为未来主流技术。(3)专利知识产权成本。该指标根据Innography数据库中的专利维持成本、起诉成本等计算得出。若指标得分较高,说明专利在较长一段时间内具有较高的技术价值和经济价值,因而更有可能占据主流市场。本研究使用专利年平均成本这一指标对其进行度量,以避免因专利生存时间不同而造成误差。

  4.1.3总体评价指标

  专利强度在Innography数据库中结合专利引用、诉讼、截止日期等10项指标构建而成。专利强度取值范围为0~10,数值越大说明专利质量越高,技术潜力越大。

  从中可见:

  ①可持续性技术(类2)引用量、家族规模、独立权利要求项数、诉讼量、知识产权成本和专利强度均高于其它技术,说明该类技术知识更加多样、新颖,企业付出更多研发成本和维护费用,因而技术价值最高、潜力最大;②去除特定污染物技术(类1)在上述6个指标方面均显著低于其它类别,说明技术价值最低,企业已经放弃对该类技术专利的申请与维护,且未在检验组中出现,说明2016-2019年已逐渐被其它两类技术所取代。需要说明的是,可持续性技术(类2)专利被引用量和发明人数指标取值最低,可能是因为可持续性技术正处于从引入阶段到发展阶段的过渡期[19],技术成熟度不高,且企业之间的技术研发与合作较少。同样地,该类技术CPC所占比例也反映了这一现象。

  从中可以看出,相较于其它两类技术,在预测组类2和检验组类a中(可持续性技术类),每个CPC占比分布均较为均匀(类2最大占比为28.2%,类a最大占比为17.6%)。这说明,该类专利技术所属知识仅在少数专利中出现,专利之间的交叉性较弱,目前还处于探索阶段,没有形成主流技术范式。此外,预测组类2与检验组类a作为同一类可持续性技术,在整个样本数据中的占比从预测组的73.28%增加到检验组的75.85%,说明该类技术市场占有率较高且呈增长态势。

  4.2技术生命周期分析

  企业在投资技术之前需要判断技术生命周期,从而准确投资处于上升期且发展潜力较大的技术[19]。本研究结合K-means聚类和专利静态评价指标,进一步从动态视角分析每类技术的生命周期。学者通常利用专利申请信息分析技术生命周期[11,20-22],这是因为:

  ①一项专利代表一个技术,专利技术信息能够为分析技术发展趋势提供较好的证据;②一项专利被颁布意味着其具有较大的商业潜力,能够保证样本数据的有效性;③专利数据能够反映整个技术生命周期;④专利数据可获取性高,利用专利数据库可以客观分析专利信息[19]。Andersen[20]以单一专利申请数增速分析技术生命周期各个阶段,总结出S型技术发展曲线,但这种方法难以精确界定不同生命阶段之间的临界点(专利曲线增速较大与增速放缓之间的临界点),因而无法精确判断技术所处发展阶段。本研究结合专利申请数量和申请人数量,通过双重指标变化趋势清晰区分技术发展不同阶段。

  本文根据属于特定技术类别的专利申请人数与专利申请数之间的关系,将技术发展划分为5个阶段[11]。其中,第一阶段为引入阶段,在该阶段新技术刚诞生,专利申请人数和专利申请数很少。第二阶段为发展阶段,研发活动较为活跃,行业进入者增多,专利数和申请人数迅速增长。

  第三阶段为成熟阶段,市场已产生主流技术范式,研发活动大大减少,专利申请数增长速度放缓,申请人数量减少。此时,技术商业价值下降,技术领域已不具有发展潜力。第四阶段为衰退期,专利数和申请人数呈下降趋势,技术逐渐被淘汰。第五阶段为恢复期,基于基础技术的新技术出现,市场逐渐恢复并进入下一个循环期。分别为预测组第一、二、三类技术生命周期曲线,横、纵坐标轴分别代表2008-2015年专利申请人数和专利申请数。

  去除特定污染物技术(第一类技术)处于第四阶段,曲线端点位置表明专利申请人数和专利申请数已降至最低水平,说明该技术已被淘汰,验证了上文静态预测结果。这是因为,去除某种特定污染物技术适用范围较小,随着人类生产生活方式逐渐向清洁生产与消费模式转变,废水有害化合物等污染物比重减少,且污染物种类也在发生改变。

  因此,原有污水处理技术无法适应新处理要求,使企业陷入污水处理技术锁定困境(赵芸潼等,2020)。专利申请人数和专利申请数量呈递增趋势,可持续性技术专利申请人数增速更快。2008-2015年,可持续性技术专利申请人数由478人增至1149人,增加了140.38%;专利申请数由137个增至246个,增加了79.56%。

  专利申请人增长率几乎是专利申请数增长率的2倍,说明该技术处于从引入阶段到发展阶段的过渡期,技术发展潜力较大,从动态视角验证了上文静态分析结果的可靠性。物理化学类技术发展趋势也为未来水体净化技术发展提供了新视角。物理化学类技术专利数与专利申请人数增长趋势虽然缓慢,但技术生命周期曲线呈上升趋势,说明该类技术处于发展期,具有较好的应用前景。因此,与第一类技术不同,物理化学类技术虽不是未来最具有发展空间的技术类别,但已经打下坚实基础,且可处理污染物范围更广,因此企业可继续使用物理化学类技术,或将其应用于水处理过程的不同环节,从而在达到清洁生产目标的同时降低使用新技术的转换成本。

  5结论与启示

  5.1研究结论

  本研究从Innography数据库中选取水体净化行业3552个专利,采用多维标度和K均值聚类法分析技术发展潜力,通过技术生命周期分析判断每类技术所处发展阶段及发展趋势,得出如下结论:

  (1)多维标度分析与K均值聚类相结合的技术预见方法更具有稳健性。本研究在聚类前首先对孤立点进行处理并根据轮廓系数确定聚类数,克服了直接进行K均值聚类易导致的主观缺陷;既采用静态指标分析专利所包含的知识元素,又从动态视角根据技术生命周期阶段判断技术未来发展趋势,静态与动态分析相互印证,提高了预测结果的可信性。

  (2)可持续性技术是未来主流技术,这些技术正处于从引入阶段到发展阶段的过渡期,在技术和商业价值上具有广阔的发展空间。这类技术追求污染物回收利用、减少二次污染和降低碳排放等目标,多个CPC均匀分布在可持续性技术中,专利知识交叉少,说明技术研发处于探索阶段,这与张振刚和罗泰晔[5]提出的纳米行业未来技术特征相似。由上文可知,可持续性技术每项专利平均发明人最少,说明目前针对该技术的研究还处于“各自为战”状态。

  (3)2008-2019年,水体净化行业技术结构发生改变,去除特定污染物技术逐渐被淘汰,行业更倾向于使用多种技术联合处理方式,处理对象更加多元。这是因为,去除特定污染物技术适用范围较窄,不利于企业产品线拓展,而多种技术联合污水处理方式为企业随市场需求调整产品线拓宽了选择空间。

  (4)物理化学类技术专利增长趋势虽然较可持续性技术缓慢,但仍是企业的主要选择。从技术生命周期分析可以看出,该类技术处于发展阶段,主要包括反渗透、臭氧氧化等技术,具有适用范围广、二次污染低等特点。虽然该类技术清洁处理效果不如可持续性技术,但在企业转型升级过程中,可将其作为过渡技术缓解企业技术升级压力。

  5.2对策建议

  基于以上研究结论,结合污水处理行业现状,本文提出如下对策建议:

  (1)目前,企业污水处理往往只关注对废水的循环利用,大量污染物在经过处理后被排放,极易造成资源流失。本文研究结果表明,污染物回收再利用是未来主流技术范式,企业在技术升级过程中应选择污染物回收利用率高的清洁工艺,如回收废水中的氮、磷等营养物质。Qi等[24]研究发现,中国污水总氮量去除率最低,仅有51.6%~79.4%,剩下的20.6%~48.4%都随处理后的废液排放。因此,未来在解决废水净化和排放达标问题时应追求资源(污染物)循环利用,实现减排、节能、资源循环利用并举的全过程绿色创新。

  (2)当前,水体净化技术在处理废水时造成了严重的环境污染。Nakkasunchi等[25]研究发现,废水处理厂增加了温室气体排放,其所需能源占全球能源需求的3%,对环境造成的负面影响大于处理或回收污染物带来的正向效益。本文研究发现,使用太阳能等清洁能源技术是未来主要发展方向。因此,企业应选择“净效益”(污染物处理效益+环境效益)为正的水处理技术,在达到污水排放目标的同时也要考虑污水处理过程对环境造成的负面影响,选择光催化降解等处理技术。

  (3)企业采用优化水体净化技术时面临大量转换成本锁定问题,在某种程度上制约了污水处理技术升级。Changotra等[26]研究发现,在制药、医疗等产生大量含毒有机废水的行业,使用化学混凝+电子束辐照+生物活性污泥处理方法尤为重要,因为污染物中的复杂化合物无法用传统单一技术处理,将新技术与传统技术相结合能够有效解决这一问题,如引入电子束辐照。

  本文研究发现,最具前景的可持续性技术类别同时包含化学、生物和光催化降解等多种技术,大多数企业目前使用的物理化学类技术依然处于发展阶段。 因此,企业在污水处理过程中可采用多类技术联合、新旧技术联合的处理方式,如将物理化学类技术与可持续性技术相结合,以降低企业采用新技术的转换成本。

  5.3不足与展望

  本文存在如下不足:第一,只在水体净化行业检验技术预见方法的适用性,未使用其它行业数据进行验证,未来可将本文研究方法拓展到其它行业,如新能源汽车行业,检验本文预见方法的稳健性。第二,限于篇幅,只根据专利CPC分类号对技术所属类别进行分类,未深入探讨专利的具体内容,未来可使用文本分析法,从专利摘要、权利要求等方面分析专利所属类别,再结合本文预见方法判断技术发展前景。第三,虽然发现能够回收双重污染物的可持续性技术是未来主要发展方向,但未探讨其所产生的环境效益,未来可进一步分析可持续性技术能够在多大程度上降低二次污染。

  参考文献:

  [1]LORENZO-TOJAY,VAZQUEZ-ROWEI,AMORESMJ,etal.Benchmarkingwastewatertreatmentplantsunderaneco-efficiencyperspective[J].ScienceoftheTotalEnvironment,2016(566-567):468-479.

  [2]HASSONF,KEENEYS.Enhancingrigourinthedelphitechniqueresearch[J].TechnologicalforecastingandSocialChange,2011,78(9):1695-1704.

  [3]赖朝安,钱娇.基于专利挖掘的移动医疗产业技术预见[J].科研管理,2018,39(10):138-147.

  [4]简兆权,柳仪.技术预见共识形成机制研究[J].科学学与科学技术管理,2014,35(9):37-47.

  [5]张振刚,罗泰晔.基于知识网络的技术预见研究[J].科学学研究,2019,37(6):961-967,985.

  [6]KIMG,BAEJ.Anovelapproachtoforecastpromisingtechnologythroughpatentanalysis[J].TechnologicalForecastingandSocialChange,2017(117):228-237.

  [7]KAPOORR,KARVONENM,RANAEIS,etal.Patentportfoliosofeuropeanwindindustry:newinsightsusingcitationcategories[J].WorldPatentInformation,2015(41):4-10.

  [8]何晓群.多元统计分析[M].北京:中国人民大学出版社,2012.

  [9]贾俊平,何晓群,金勇进.统计学[M].北京:中国人民大学出版社,2014.

  作者:简兆权1,赵芸潼1,张少轩2

NOW!

Take the first step of our cooperation迈出我们合作第一步

符合规范的学术服务 助力您的学术成果走向世界


点击咨询学术顾问