中文专利侵权自动检测研究

基本信息
批准号:61671070
项目类别:面上项目
资助金额:58.00
负责人:吕学强
学科分类:
依托单位:北京信息科技大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:陈博兴,李宝安,殷旭,王超,夏红科,苗琳,王浩,李江龙,朱丽雅
关键词:
专利侵权领域本体专利文本表示专利相似度计算专利日志
结项摘要

In the information explosion and knowledge competitive era, the sharp increase in patent data causes infringement and great economic loss directly. We propose an automatic detection method of Chinese patent infringement. We research some important technologies: extraction of patent terms, construction of patent ontology, extension of patent query, representation of patent texts, similarity computing of patent texts, and focus on resolving identification of patent terms based on patent query logs and construction of logical relations among concepts in ontology; patent text representation based on multi-dimension and patent texts similarity computing for multi-objective. Starting from the query logs and texts of patent, we propose a learning method of terms characteristics based on the patent search log, an extraction method of patent terms based on Deep learning, a construction method of logical relations among concepts based on user behavior analyze, an query extension method based on logical relations, a representation model of patent texts of based on structure, knowledge and rights. By estimating the similarity among the model of structure, knowledge and rights of patent texts, we achieve patent infringement detection automatically. Through the research, we provide the new theory and method for patent infringement detection and promoting national economic and social development.

在信息爆炸和知识竞争激烈的时代,专利数据急剧增加,社会面临侵权案件时有发生,直接造成重大经济损失。本项目提出一种中文专利侵权自动检测方法。通过对专利术语提取、专利本体库构建、专利检索查询扩展、专利文本表示、专利文本相似度计算等关键技术的研究,重点解决专利侵权自动检测中基于专利搜索日志的术语识别以及本体概念逻辑关系构建、多维度的专利文本表示、专利文本的相似度计算三大问题。本项目从专利搜索日志和专利文本入手,提出基于专利搜索日志的术语特征学习方法,基于Deep learning的术语识别方法,基于用户行为分析的概念间逻辑关系构建方法,基于逻辑关系的专利查询扩展方法,基于结构、知识、权利的专利文本全信息表示模型。在专利文本的全信息表示模型之上进行相似度计算,实现专利侵权自动检测。本项目的研究可以为专利侵权研究提供新的理论和方法,促进国民经济和社会发展。

项目摘要

在信息爆炸和知识竞争激烈的时代,专利数据急剧增加,社会面临侵权案件时有发生,直接造成重大经济损失。本项目提出一种中文专利侵权自动检测方法。通过对专利术语的提取、专利本体库的构建、基于结构、知识、权利的专利文本全信息表示模型。在专利文本的全信息表示模型之上进行相似度计算,实现专利侵权自动检测。.提出了基于词向量与领域本体相结合的专利查询扩展方法。首先利用词向量模型训练专利文本的词向量,对检索关键词进行语义层级的查询扩展;同时结合专利领域本体进行检索词上下位关系、同位关系扩展;最后取两部分扩展词的并集。通过实验对比,该方法有效提高了专利文本检索的查全率,能够满足专利审查的检索要求。.提出了考虑词性以及专利文本的结构特征,将IPC分类号、标题、摘要、权利要求书作为主要研究对象,词在不同位置出现分别赋予不同的权重,并且通过word2vec将词表示成词向量的形式,通过词汇跟词汇之间的语义信息改进余弦相似度公式。最后通过实验得到提出方法相比于传统文本相似度计算方法准确率和召回率都有所提高,从而验证了提出方法的有效性。.提出了一种基于融合策略的中文专利文本相似度算法。首先提取出专利文本中的关键词及SAO三元组结构,然后提出了一种SAO三元组之间的相似度计算方法和基于SAO三元组专利文本相似度算法。将基于VSM向量空间模型和基于SAO三元组的专利文本相似度算法进行融合,实验结果表明,该方法对计算专利文本相似性有较好的结果。.提出了基于篇章级,句子级和术语级等不从层面的相似度计算方法。不同的专利结构在专利文本相似度计算中所占的比重不同。针对不同的专利的结构,采用不同的相似度的计算方法,然后对不同的专利结构赋予不同的权重可以有效的计算专利文本之间的相似度从而衡量专利之间是否侵权。.集成上述方法构建中文专利侵权自动检测的原型系统,并将相关技术在知识产权公司-知呱呱有限公司得到推广和应用,大大减少了公司在专利代理申请,专利侵权案件委托方面的人力成本。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
5

基于余量谐波平衡的两质点动力学系统振动频率与响应分析

基于余量谐波平衡的两质点动力学系统振动频率与响应分析

DOI:10.6052/1672⁃6553⁃2017⁃059
发表时间:2018

吕学强的其他基金

批准号:61271304
批准年份:2012
资助金额:75.00
项目类别:面上项目
批准号:60872133
批准年份:2008
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

中文专利检索中关键技术研究

批准号:61003159
批准年份:2010
负责人:任飞亮
学科分类:F0211
资助金额:18.00
项目类别:青年科学基金项目
2

基于中文文本挖掘技术的SIPO专利知识演化分析

批准号:61272370
批准年份:2012
负责人:丁堃
学科分类:F0211
资助金额:20.00
项目类别:面上项目
3

全球专利竞赛下的企业专利运营行为模式与专利导航机制研究

批准号:71673069
批准年份:2016
负责人:王珊珊
学科分类:G0403
资助金额:47.00
项目类别:面上项目
4

专利代理服务对专利质量的作用机理研究

批准号:71603038
批准年份:2016
负责人:谷丽
学科分类:G0403
资助金额:18.00
项目类别:青年科学基金项目