面向专利大数据的机器学习与推理研究

基本信息
批准号:61402481
项目类别:青年科学基金项目
资助金额:26.00
负责人:汪慎文
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:张英华,胡文锐,杨叶辉,何泽文,唐永强,张志忠
关键词:
元知识语义网络概率图模型语义鸿沟超网络
结项摘要

With the rapid increase in patent applications, both creative examination for each patent and content analysis for total patent face unprecedented challenges. How to tackle the uncertainty of the relationship among the massive, heterogeneous, multi-modal and sparse patent data becomes a challenging problem for patent examination, patent analysis, patent planning and patent promotion. In view of this, we will develop theories and methods of machine learning and reasoning for big patent data, when we are undertaking a task of State Patent Bureau: the analysis and processing of massive data of biological characteristics. Firstly, to solve the uncertainty in the relationship among massive data, this project will innovatively propose methods for patent dimension reduction, patent feature selection and patent feature integration based on manifold learning and fuzzy reasoning. Secondly, by regarding a patent as a graphic node in probabilistic graphical model, semantic super-network will be introduced and constructed; To achieve efficient knowledge learning and knowledge reasoning, two novel algorithm will be respectively designed to extract meta-knowledge and implement the jointly inference. Finally, an integrated platform for in-depth semantic analysis of big patent data will be developed and we will conduct experiments on the biological characteristics of State Patent Bureau to demonstrate the effectiveness of the proposed theories and methods. The aim of this project is to provide a theoretical guidance for solving some compelling and unsolved problems in patent examination and services, to meet the in-depth semantic requirements of patent for patent examiners and patent users.

随着专利申请量的快速增长,对每一件专利创新性审查和整个专利库内容分析遇到前所未有的挑战,如何处理海量、异构、稀疏的专利大数据之间潜在的关联不确定性,是专利审核、分析、规划和推广人员面临的重要难题。针对我们正在承担的国家专利局生物特征大数据分析与处理任务,研究专利大数据的机器学习与推理理论和方法。首先,针对专利大数据关联、不确定性,研究基于流形学习和模糊推理的专利特征降维、选择和融合方法;其次,将每一个专利作为概率图模型的节点,研究构建基于概率图模型的语义超网络方法,以及萃取专利元知识和建立高效联合推理算法,实现对专利大数据的语义关联学习与知识推理;最后,针对国家专利局生物特征大数据库,研发的专利大数据深度语义分析平台,验证本项目提出理论和方法的正确性、有效性。预期研究成果有助于解决专利审核与服务中的亟待解决的难题,满足专利审查人员和广大专利用户对专利深层语义分析的需求。

项目摘要

如何处理海量、异构、稀疏的专利大数据之间潜在的关联不确定性,是专利审核、分析、规划和推广人员面临的重要难题。通过三年的研究,本项目完成的研究工作和取得的成果如下:(1)运用拉普拉斯特征映射理论,提出解决专利特征降维、选择和融合的方法,建立可用于多特征处理的技术手段和理论框架;(2)运用神经网络和概率图模型理论,提出构建专利语义网络方法;(3)基于熵和Keeney-Raiffa算法等理论,提出萃取专利元知识和建立高效联合推理算法。研究成果在国内外权威期刊上共发表学术论文22篇,其中SCI索引5篇、EI索引3篇,培养研究生7人。项目负责人凭借本课题研究成果以优异成绩通过中共河北省委、河北省政府“首批青年拔尖人才支持”期满考核,且获得 “河北省青年拔尖人才”第二个支持周期的经费资助等荣誉和奖励。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

汪慎文的其他基金

相似国自然基金

1

面向大数据的机器学习理论与方法

批准号:61332007
批准年份:2013
负责人:朱小燕
学科分类:F0201
资助金额:300.00
项目类别:重点项目
2

视频问答中的机器学习与推理方法研究

批准号:61802053
批准年份:2018
负责人:袁召全
学科分类:F0210
资助金额:27.00
项目类别:青年科学基金项目
3

面向大规模数据的机器学习算法研究

批准号:61175050
批准年份:2011
负责人:吴高巍
学科分类:F0603
资助金额:54.00
项目类别:面上项目
4

面向大数据的随机森林机器学习理论与算法研究

批准号:61602482
批准年份:2016
负责人:张英华
学科分类:F06
资助金额:21.00
项目类别:青年科学基金项目