面向大规模多源数据的人物画像和定位分析关键技术

基本信息
批准号:U1736204
项目类别:联合基金项目
资助金额:248.00
负责人:李涓子
学科分类:
依托单位:清华大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:漆桂林,曹卫兵,许斌,崇志宏,张祥,朱晓乾,廖文军,侯磊,林衍凯
关键词:
语义计算人物画像和定位知识图谱表示学习知识工程
结项摘要

Person profiling and positioning, realizing the structural depiction and deep analysis of person information, play an important role for social development and national security. The key scientific problem that this project will deal with is to study the theoretical approach for person-event knowledge graph construction from large-scale and multi-source unstructured data and provide knowledge services. In order to deal with this problem, we will study the key technologies of person profiling and positioning which are data-driven and knowledge-guided. Including: study the person-event unified knowledge representation model by combining symbolic representation and representation learning, thus support the semantic computing and reasoning of person profiling and positioning analysis; study methods of semantic content generation for person profiling by combining representation learning and knowledge-guidance, thus establish person-event profile knowledge graph from large-scale and multi-source unstructured data; study semantic analysis methods based on person-event relation network, thus support multi-dimension and dynamic analysis of person, event and their relationships; study methods of visualized analysis and prediction based on context-awareness and knowledge-guidance; study how to establish the typical applications of key person knowledge bases related to China, thus provide application verification of key technologies of the project. The result of this research will strength the study and application of constructing person-event knowledge graph from large-scale unstructured documents, thus shows its significance for intelligent knowledge service.

人物画像和定位实现对人物信息的结构化刻画和深度分析,对社会发展和国家安全具有重要作用。本项目以面向大规模多源非结构化数据的人物—事件画像知识图谱构建和服务的理论方法为关键科学问题,研究数据驱动和知识引导相结合的人物画像和定位分析关键技术。包括:研究符号表示和表示学习相结合的人物—事件统一知识表示模型,支持人物画像和定位分析的语义计算和推理;研究表示学习和知识引导相结合的人物画像语义内容生成方法,利用大规模多源非结构化数据建立人物—事件画像知识图谱;研究基于人物—事件关系网络的语义分析方法,支持人物、事件及其关系的多维和动态分析;研究情景感知和知识引导的可视化分析和预测方法,支持人物画像和定位分析的知识服务;研究建立涉华关键人物知识库示范应用,对项目关键技术进行应用验证。研究成果将深化从大规模非结构化文档构建人物—事件知识图谱的研究与应用,对智能知识服务具有重要意义。

项目摘要

面向多源大规模数据的人物画像和定位是国家重大需求,对社会发展和国家安全具有重要作用。项目以大规模多源非结构化数据的人物—事件画像知识图谱构建和服务为关键科学问题,从多源数据统一建模、语义内容生成、多维语义分析和决策支持服务以及实验验证五个方面展开研究。项目已经完成项目计划,取得了创新性成果。..主要创新点包括:在统一建模方面,提出了融合实体和词义的联合表示学习方法和知识增强的大规模预训练语言模型KEPLER,为人物画像和定位提供了良好的表示和计算支撑;在语义内容生成方面,构建了当前最大的通用领域事件检测数据集MAVEN,提出了基于对比预训练学习的事件抽取和融合依存句法知识的开放信息抽取方法,提升了人物事件画像的覆盖度和精度;在语义分析方面,提出了面向稀疏知识图谱的多跳推理、基于根因分析框架的事件溯源和基于prompt的事件因果关系识别方法,为人物事件动态关系分析提供有力支持;在决策服务方面,提出了基于序列问答和强化学习的多维语义搜索和基于话题指导的摘要技术。应用上述研究成果,项目构建了大规模跨语言知识图谱XLORE2.0,包含了26,146,618个的实例,2,351,701个概念,510,404个属性以及丰富的语义关系,为人物画像和定位分析提供海量的通用知识;构建了NewsMiner新闻挖掘和服务系统,提供新闻订阅、事件搜索和在线新闻事件分析服务,支持涉华关键人物和事件的分析和挖掘。..项目成果在国内外重要学术会议和期刊上发表论文53篇,其中人工智能和自然语言处理顶级会议论文(AAAI、IJCAI、ACL、EMNLP、COLING等)30篇,获得NLP-NABD 2018、 JIST 2018和JIST 2019最佳论文奖。申请发明专利25项,软件著作权3项。项目培养了毕业博士生10名,硕士生22名,一人获得2021年中国中文信息学会优秀博士学位论文提名奖,一人获得2019年江苏省计算机学会优秀博士论文奖。出版《知识图谱:方法、实践与应用》专著一部。项目关键技术获得2020年国家科技进步奖二等奖、2020年中文信息学会钱伟长科技进步一等奖和2020年度电力科技创新奖一等奖。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
5

敏感性水利工程社会稳定风险演化SD模型

敏感性水利工程社会稳定风险演化SD模型

DOI:10.16265/j.cnki.issn1003-3033.2021.04.003
发表时间:2021

李涓子的其他基金

批准号:90604025
批准年份:2006
资助金额:32.00
项目类别:重大研究计划
批准号:60973102
批准年份:2009
资助金额:32.00
项目类别:面上项目
批准号:61035004
批准年份:2010
资助金额:230.00
项目类别:重点项目
批准号:60443002
批准年份:2004
资助金额:10.00
项目类别:专项基金项目

相似国自然基金

1

面向大规模多源数据的人物画像及定位技术

批准号:U1736205
批准年份:2017
负责人:管晓宏
学科分类:F0607
资助金额:248.00
项目类别:联合基金项目
2

面向大规模多源数据的人物画像及定位技术

批准号:U1736207
批准年份:2017
负责人:薛广涛
学科分类:F0607
资助金额:254.00
项目类别:联合基金项目
3

面向深海AUV的多源数据驱动定位方法研究

批准号:51679213
批准年份:2016
负责人:冀大雄
学科分类:E1102
资助金额:62.00
项目类别:面上项目
4

面向领域本体的多源异构数据聚合和语义标注关键技术研究

批准号:61272015
批准年份:2012
负责人:张瑞玲
学科分类:F0607
资助金额:61.00
项目类别:面上项目