专利信息分析的专利信息分析方法
专利信息分析方法是以文献计量学为基础,借助其他学科的知识和相关工具。以往的专利信息分析主要是从专利文献中人工提取大量专利信息,运用相关统计方法并结合行业经验进行分析处理,发掘隐藏在专利文献背后的信息,为企业技术创新管理决策服务。所以当时主要的分析方法有原文分析法、简单统计分析法、基于简单统计的图表法、动态向量法等等。
1.原文分析。
通过检索竞争对手的专利说明书,认真阅读和分析,掌握竞争对手新产品、新技术的开发特点,包括寻找差距、技术改进、技术合成、专利技术原理等。
2.简单的统计分析。
按照专利发明人数量、专利申请人数量、专利分类号和专利文献数量分别进行统计分析。通过对相关情况的统计分析,可以了解各国科技进步的现状,技术研究兴趣或热点的转移,在一定程度上找出当前技术发明人的关注点和本技术领域的发展方向,看到某一技术领域的竞争,甚至判断出最活跃的领域。
3.搭配的统计分析。
通过专利统计中的专利分类号、专利权人、专利申请日(授权公布日)、专利申请国的组合统计,得到各种统计信息,然后对这些统计信息进行分析。
4.关键词频率统计。
(1)删除重复的专利申请,然后从专利条目、摘要和标题中提取一些带有技术实验概念的关键词;②统计关键词出现的频率;(3)读意,是出现概率大的关键词的逻辑组合,是对技术概念的重新理解。
5.技术细分后再统计。
根据层次树原理,对一项技术进行细分,逐项统计其下属概念。
6 .指标变化图和技术趋势及特征对照表。
技术趋势和特点表主要用于从技术领域和产品的某些功能等角度反映不同企业在不同年份申请专利的技术趋势和特点,从而比较各企业的技术发展趋势和方向。主要形式有:不同年份、不同技术领域的企业技术发展对比,不同科研课题对比,不同企业不同科研课题对比,各种因素的回归分析。
7.矢量动态模型法。
专利文献不仅反映了科学技术的数量关系,还隐含着科学技术发展的方向。所以用向量的概念来表示。向量模型法的应用是对统计动态数据进行向量建模,进而对科学发展趋势进行评价和预测。
8.专利引用分析方法。
分析专利文献引用参考文献的现象,揭示其数量特征和记忆规律,并据此评价技术发展趋势。
9.主题数据分析法。
所谓“主题数据分析法”,就是根据专利文献在国际发明分类表中的分散程度,对一篇主题文献的地理分布和研究内容进行整理、组合和分析,预测全球创新活动最活跃的国家和重点研究的领域。
二、专利信息分析方法的最新发展
随着计算机的普及,信息技术和网络技术的发展,专利信息分析逐渐从手工处理转向以计算机为工具的时代。这为专利信息分析提供了极大的便利,也促进了专利信息分析方法向自动化、智能化和可视化发展。
1.计算机量化处理。
为了定量分析每个领域包含的数百篇专利文献,需要对这些专利文献的申请日、主分类号、优先权申请国、申请人、公布号等描述项进行检索、筛选、统计并绘制图表。用手工方式显然费时费力。因此,有必要建立专利信息分析数据库,利用计算机分析和统计方法对数据库中的专利文献进行定量分析。
在专利信息分析数据库中,利用EXCEL电子表格的强大功能,对各个描述项进行排序,筛选出各个年份、国家、公司的专利申请号,然后对以上各项进行定量统计,从而做出有针对性的统计图表,从各个方面了解该领域的专利发展情况。具体来说,主要包括:①专利申请数量的时间分布,可以衡量某一技术领域的未来发展趋势;(2)专利文献技术主题分类,可以对技术主题进行分类,并做出技术主题分布图;(3)通过统计有优先权国家的国内专利申请数量,可以知道每个国家在该领域的技术实力;(4)统计各公司拥有的专利数量,可以揭示各公司在该技术领域的技术经济实力;⑤公司国外专利申请情况,统计拥有两个以上国家的专利申请数量,绘制公司国外专利申请数量分布图;⑥专利申请数量在不同国家的分布,找出在不同国家面临的竞争对手,可以帮助我们了解外国公司在这些国家的市场竞争程度;⑦各国专利申请的统计分析可以帮助我们了解各国公司的竞争情况。
2.基于相似度函数的专利信息分析方法。
这里说的相似度函数包括:基于专利引用的相似度函数和基于术语并发的相似度函数,文献中基于术语并发的相似度函数也有效。可靠的数据源为每个文档提供一致的索引术语,这些术语用于基于术语并发性建立相似性函数。
使用SQL查询语句很容易执行这个函数。在计算出文档之间的相似度值后,我们使用强制直接放置或自组织神经网络技术将文档映射到二维空间中,形成文档簇来探索文档之间的关系。面向力的搭配法是在开始时,所有文档都放在平面的中心,文档之间的力与它们的距离成反比,与它们的相似值成正比;如果相似度值大于0,则表示吸引,否则表示排斥;力学上力的方向服从库仑定律。重复此过程,直到形成稳定的文档结构图。自组织神经网络技术是通过输入具有相似矩阵行为的变量来训练矩形自组织神经网络。一般采用新的自组织神经元矩阵。在训练之后,N维空间中神经元连接权重的密度分布与训练向量的密度分布相匹配。
一般来说,专利分析可以分为定量分析和定性分析。
1,定量分析
定量分析主要是基于专利文献外观特征的统计分析,即通过专利文献固有的标引项识别相关文献,然后对相关指标进行统计,最后以不同方式解释相关数据的变化,以获得动态发展趋势的信息。
(1)统计对象和角度
①统计对象一般以专利数量为基础。②可以按照专利分类、专利权人、年份、国别,从不同角度进行统计。当对专利信息进行分类统计时,根据各个领域的专利数量,就可以知道哪些技术领域发明行为活跃,哪些技术将被突破,哪些技术即将被淘汰。如果把专利信息按国家统计,可以发现被统计国家的科技发展战略以及在各个领域的地位。这一统计结果有助于人们了解某一时期各国科研发展的重点。如果按照专利权人来统计专利,就可以找到某个领域的重要技术拥有者,或者哪个公司在这个领域有重要地位。(2)统计的主要指标
①专利数量。某一技术类别的专利数量可以用来衡量该技术领域的技术活动水平;一个公司或专利权人历年申请的专利数量反映了其技术活动的发生、发展过程和发展趋势。专利数量可以用来比较不同国家在不同时期、不同领域技术活动的产出和寻求工业产权保护的意向。②同一家族的专利数量。一项发明的专利族数量反映了公司专利申请领域的广度,也反映了这项发明的潜在价值。因为翻译和特殊法律帮助的费用,在国外申请专利比在自己国家要贵得多。只有那些被公司认定为最具商业价值的发明,才会在多个国家申请专利,以保护未来投资和产品出口的专有权。③专利引用数量。一个专利被后续专利引用的次数可以反映出这个专利的重要性,因为一个重要的专利会伴随着大量的改进专利,而这个重要的专利又会被改进专利重复引用。引文揭示了专利之间的关系,可以用来跟踪不同技术对应的专利网络,找到不同技术交汇点的专利。可惜中国的专利数据库无法提供专利被引用的数量,很可惜。④专利增长率。专利增长率衡量的是专利数量随时间增长的百分比,可以显示技术创新随时间的变化是增加还是减缓。比如专利季增长率,就是将某一季度企业获得的专利数量与上一季度获得的专利数量进行比较,计算出本季度获得的专利数量与上一季度相比增减的百分比率。专利年增长率是专利增长与上一年相比的百分比,用来衡量过去一年技术活动的变化。⑤科学相关性。科学相关性衡量专利(主题专利)引用科研论文或研究报告的数量,衡量专利技术与前沿科研的关系。科学相关性的值具有行业依赖性:机械行业的科学相关性平均值接近于零,而高科技生化行业的科学相关性平均值可能高达15。⑥技术生命周期。技术生命周期衡量企业专利申请文件扉页引用专利技术的平均年限。因此,技术生命周期可以理解为介于最新专利和最早专利之间的一段时间。如果技术生命周期很短,说明正在努力开发一种相对较新的技术,而且这种技术的发展和创新非常快。技术生命周期是行业依赖性的,比较热门的行业技术周期比较短,比如电子大概3-4年,医药8-9年,造船15年。⑦专利效率。专利效率衡量的是一定研发支出所创造的专利数量产出,用于评价企业在预定时间内专利数量产出的科研能力和成本效率。专利产生越多,专利效率越高,企业的技术研发能力越强。(8)专利实施率。专利实施率能否有效实施,能否带来科技创新,对于那些尚未实施的专利技术来说,还是未知数。一般发明专利的实施要经历一个发展过程,发展并不总是成功的。很多发明专利技术因为现有技术条件下无法解决的技术难点或无法达到预期效果,不得不半途而废或最终放弃。发明专利的实施可以从技术性能、经济效益、社会效益、市场因素、产业发展和生产能力、宏观环境和产业化风险等方面进行衡量。专利实施率越高,专利对技术发展和创新的贡献越大,与技术发展的结合越紧密。中国的专利实施率只有30%左右,远低于欧美和日本的水平。⑨行业标准化指数。在跨行业横向比较中,行业间的差异给不同行业间专利指标值的比较带来了麻烦,因此需要使用行业标准化指标。行业标准化指数值是用企业的指数值除以该企业所在行业的指数平均值得到的。比如化工行业有30家企业,其科学关联度的平均值为3.7,那么每个化工企业科学关联度的标准指标值应该是每个企业科学关联度的指标值除以3.7。这样就可以剔除不同行业带来的不同影响,进而找出每个行业中表现最好的企业。
(3)统计的主要内容
①专利技术的时间分布研究。也就是说,以时间为横轴,以专利申请量(或批准量)为纵轴,一般通过统计专利量随时间的变化来预测趋势。任何技术都有一个产生、发展、成熟、老化的过程。历年专利申请量和专利引用量的变化可以确定该技术的发展趋势和活跃期,为科研项目和技术开发等重大决策提供依据。对不同技术领域专利的时间分布进行对比研究,可以确定在一定时期内哪些技术领域是活跃的,哪些技术领域是停滞的。②专利技术的空间分布研究。即通过比较不同公司和企业的专利数量,可以反映其技术水平和实力。空间分布一般用于识别竞争对手,分析其技术策略。通过按专利权人统计某一技术类别的专利申请,可以得到某一技术在不同公司或企业中的分布情况,知道哪些公司或企业在该领域投入较多,专利活动较为活跃,技术水平领先;通过统计公司在不同技术类别的专利频率,可以知道公司最活跃的领域,也就是公司发展的重点领域。此外,通过搜索一个专利的同家族专利,可以得到这些专利申请的地域分布,从而判断其商业价值,了解一个公司技术输出的重点领域;还可以为技术引进提供依据,为产品避开对方的保护区提供信息。
(4)测量技术发展不同阶段的统计参数。
技术增长率v:其中a:当年发明专利申请(或批准)数量;答:发明专利申请累计数(或批准累计数)追溯5年。经过几年的连续计算,V的值在增加,说明该技术处于萌芽或成长期。技术成熟度系数α:。其中a同上,b为当年实用新型专利申请(或批准)数。经过几年的不断计算,α值降低,反映了技术的成熟。技术老化系数β:。其中A和B同上,C为该年度外观设计专利或商标的申请(或批准)数量。经过几年的不断计算,β值越来越大,这表明该技术正在变得过时。新技术特性系数n: n = υ 2+α 2。其中υ为技术增长率,α为技术成熟度系数。它是反映一项技术的新兴或老化的综合指数。n值越大,新技术的特性越强,表明它更有发展潜力。2.定性分析
定性分析又称技术分析,是根据专利的技术含量或“质量”来识别专利,并根据专利的技术特征对相关专利进行合并,使之有序。这与只依赖专利文献外观特征的统计分析有很大不同。定性分析通常用于获取有关技术趋势、企业趋势和特定权利的信息。我们可以从发明的目的、原理、材料、结构、方法五个方面来考虑重要专利的内容,将重要专利按其异同进行分类。如果专利内容是基于原理,说明这项技术还不成熟;如果专利内容侧重于用途的多样性,说明该技术已经实用化。此外,根据专利内容列表分析各大公司在某一技术领域的专利,可以看出各公司的技术特点和发展重点;根据技术内容的异同将相关专利划分为专利组,分析一个公司所拥有的不同专利组或不同时期专利组的变化,从而分析和预测一项技术或产品发展过程中的关键问题,未来的发展趋势和应用趋势,以及与其他技术的关系。
由于涉及到技术的具体内容,定性分析的工作繁重而复杂。至于是用定量分析还是定性分析,要看要解决的问题和要掌握的专利数据。事实上,往往需要定性分析和定量分析相结合才能达到良好的效果。例如,我们可以先通过定量分析(专利申请或批准的数量可以反映技术活动的水平)来确定哪些公司在某个技术领域具有技术优势,并识别出该技术领域的重要专利(一项专利被后续专利引用的数量反映了专利的重要性),然后对这些公司的重要专利进行定性分析。
专利信息的定量分析和定性分析通过量变和内部质变反映技术的发展状况和趋势。两者既有区别,又有必然联系。数量的分类需要以质量为基础,质量的体现需要通过数量。所以在实际工作中,两者结合会取得更好的效果。