基于噪音数据的中文知识图谱增量式构建研究

基本信息
批准号:61876115
项目类别:面上项目
资助金额:62.00
负责人:陈文亮
学科分类:
依托单位:苏州大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:周夏冰,王星,郁俊杰,杨耀晟,郁圣卫,何正球,卢奇,陈伟,朱宗奎
关键词:
社会关系网络知识图谱命名实体识别实体关系抽取噪音数据
结项摘要

Building Knowledge Graph is an important research topic in Artificial Intelligence. The research on Chinese Knowledge Graph lags largely behind that on English at scale and correctness. It becomes one of the bottlenecks of Artificial Intelligence Applications in China. The main task for building Knowledge Graph is information extraction. To tackle with the problems of noisy labeled data, this project aims to utilize large noisy labeled data to build Chinese Knowledge Graph and learn over time to enlarge Knowledge Graph. The main content includes: 1) Build a model for Named Entity Recognition based on large noisy labeled data; 2) Build a model for Relation Extraction based on large noisy labeled data; 3)Verify new learned knowledge from multi-sources and multi-views; 4)Build a model for knowledge fusion based on confidence computing. Based on the above techniques, we build a platform for Knowledge Graph Construction. This project will make important contributions for research on Knowledge Graph and provide reliable supports for further applications.

知识图谱构建是人工智能的一个核心问题。与英文知识图谱相比,中文知识图谱在规模和正确性上还存在较大差距,成为制约国内人工智能发展的一个瓶颈。知识图谱构建的一个关键技术是信息抽取技术。本项目针对中文知识图谱增量式构建过程中存在的标注训练语料存在大量噪音和中文信息抽取系统性能差等关键问题,重点探索如何利用大规模带有噪音的标注语料来改进中文信息抽取性能,持续可靠地扩展中文知识图谱的规模,大力提高知识图谱构建的研究水平和实用价值。为此,本项目拟从四个方面开展创新性研究:1)研究基于噪音标注数据的实体识别模型;2)研究基于噪音标注数据的实体关系抽取模型;3)研究基于多信息源的知识验证模型;4)研究基于可信度计算的知识融合模型。最后,集成上述研究成果,构建一个领域自适应能力强的大规模知识图谱构建平台。本项目的开展将为知识图谱研究作出重要贡献,并为后续应用研究提供有力支持。

项目摘要

知识图谱构建是人工智能的一个核心问题。本项目针对中文知识图谱增量式构建过程中存在的标注训练语料存在大量噪音和中文信息抽取系统性能差等关键问题,重点探索如何利用大规模带有噪音的标注语料来改进中文信息抽取性能,持续可靠地扩展中文知识图谱的规模,大力提高知识图谱构建的研究水平和实用价值。在项目执行四年以来,研究工作主要从四个方面展开:1)研究基于噪音标注数据的实体识别模型;2)研究基于噪音标注数据的实体关系抽取模型;3)研究基于多信息源的知识验证模型和知识融合模型;4)构建一个知识图谱构建平台。主要成果如下:1)发表15篇论文,其中领域内国内外顶级会议或期刊7篇;2)申请专利5项,软件著作权3项;3)培养9名硕士生和3名博士生;4)实现一个中文信息抽取平台和知识图谱构建平台。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
4

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

陈文亮的其他基金

批准号:51875283
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:61572338
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:61203314
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:81402926
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:81671727
批准年份:2016
资助金额:56.00
项目类别:面上项目
批准号:30700168
批准年份:2007
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

基于属性描述的增量式知识获取系统

批准号:69075010
批准年份:1990
负责人:陈世福
学科分类:F0607
资助金额:2.50
项目类别:面上项目
2

基于多源异构数据的知识图谱构建、推理与问答研究

批准号:61772059
批准年份:2017
负责人:张日崇
学科分类:F0607
资助金额:61.00
项目类别:面上项目
3

矿床领域文本数据挖掘与知识图谱构建

批准号:41902305
批准年份:2019
负责人:王成彬
学科分类:D0215
资助金额:27.00
项目类别:青年科学基金项目
4

基于主动增量式学习的故障诊断知识挖掘方法

批准号:61403042
批准年份:2014
负责人:王健
学科分类:F0301
资助金额:24.00
项目类别:青年科学基金项目