东盟多语种事件知识图谱构建与推理方法研究

基本信息
批准号:61866008
项目类别:地区科学基金项目
资助金额:37.00
负责人:黄永忠
学科分类:
依托单位:桂林电子科技大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:李笠,郑彦斌,张朦禹,云宏旭,郭智,田磊,夏志超
关键词:
东盟信息抽取表示学习事件知识图谱低资源语言Web
结项摘要

This proposal faces the urgent need of the country's "The Belt and Road" strategy for its deep cognition of ASEAN. It comprehensively uses technologies such as artificial intelligence, big data and language engineering to carry out massively parallel corpora acquisition and annotation of low-resource languages, event ontology model, deep learning Event recognition and relation detection, cross-lingual semantic links based on bilingual collaborative training, distributed knowledge representation and reasoning, and will reach the following innovations:.(1) The project will propose the automatic construction and reasoning method for building ASEAN multi-lingual large-scale event knowledge graph and will provide knowledge support for real-time get and analysis of dynamic information of ASEAN countries..(2) Aiming at the lack of ASEAN semantic knowledge in the existing large-scale knowledge base in the world, a bilingual collaborative training method is proposed to realize the alignment of multi-lingual event elements and effectively support knowledge extraction, fusion and analysis of minority language event..(3) The project will propose a model of event recognition and relation detection based deep learning. By constructing a learning model with multiple hidden layers and massive training data, learning more latent features will eventually improve the accuracy of event recognition and relation detection..(4) The project will utilize distributed representation learning method to infer the event knowledge graph to predict the types, attributes and relations of missing events.

面向国家“一带一路”战略对东盟深度认知的迫切需要,综合运用人工智能、大数据和语言工程等技术,开展低资源语言大规模平行语料库获取与标注、事件本体模型、基于深度学习的事件识别和关系检测、基于双语协同训练的跨语言语义链接、分布式知识表示及推理等问题研究,达成如下创新:.(1)研究提出东盟多语种大规模事件知识图谱自动构建和推理应用方法,为实现对东盟各国家动态信息的实时掌控和分析提供知识支撑。.(2)针对现有世界上大型知识库东盟语义知识缺乏现状,提出基于双语协同训练方法实现多语言事件要素的对齐,有效支撑小语种事件知识抽取、融合和分析。.(3)提出利用深度学习方法构建事件识别和关系检测的模型。通过构建具有很多隐层的学习模型和海量的训练数据,学习更加抽象的特征,最终提升事件识别和关系检测的准确性。.(4)运用分布式表示学习方法对事件知识图谱进行推理,实现对缺失事件的类型、属性、关系等进行预测。

项目摘要

随着“一带一路”战略稳步推进,中国将不断加深与东盟各国在各方面的交往。通过本课题研究,探索提出低资源条件下事件知识图谱构建与应用的方法,可为我国开展东盟舆情分析、情报搜集以及对外合作策略制定等提供技术与方法支持,对于提升对东盟各国政治、经济、文化、军事等国际热点事件的实时监测和预判能力,具有重要的理论意义和应用前景。.课题综合运用人工智能、大数据和语言工程等技术,开展了低资源语言大规模平行语料库获取与标注、事件本体模型、事件识别和关系检测、跨语言语义链接、分布式知识表示及推理等问题研究,突破东盟国家低资源事件要素抽取与大规模知识图谱构建、跨语言迁移学习、多跳知识推理技术等关键技术,开发相关原型验证系统并进行转化应用,在东盟多语种大规模事件知识图谱自动构建、基于双语/多语协同学习的知识对齐、高性能多跳知识推理与应用等方面取得重要创新,研究成果丰富,达到预期目标。主要包括:.(1)围绕“人、地、事、物、组织”五要素,提出面向东盟的目标监测本体模型,为东盟国家多元语义数据融合提供有效质量保证;.(2)提出基于跨度选择的低资源事件要素抽取、基于文本生成的低资源事件要素抽取等方法,提升了事件要素抽取精度;.(3)提出基于知识蒸馏的跨语言句向量训练模型,实现基于多特征的句子、段落和篇章等多粒度对齐方法,通过该方法获得近3000万条平行句对。.(4)通过对世界知识库进行裁剪和非结构化文本知识抽取相结合的方式,构建东盟大规模知识图谱。目前构建的知识图谱实体数超过2000万条,关系数超过3亿条;.(5)提出高性能多跳推理计算框架,实现高效推理算法并综合运用系统层性能优化方法,有效提升大规模知识图谱路径搜索效率,并通过知识推理补全缺失信息,以丰富、扩展知识图谱,为实现目标画像、关系挖掘、事件推理等任务提供技术支撑。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
2

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017

黄永忠的其他基金

相似国自然基金

1

知识图谱推理的理论与方法研究

批准号:61502022
批准年份:2015
负责人:罗杰
学科分类:F0607
资助金额:21.00
项目类别:青年科学基金项目
2

面向社会事件的跨模态知识构建、演化与推理

批准号:61872424
批准年份:2018
负责人:鲍秉坤
学科分类:F0211
资助金额:64.00
项目类别:面上项目
3

基于多源异构数据的知识图谱构建、推理与问答研究

批准号:61772059
批准年份:2017
负责人:张日崇
学科分类:F0607
资助金额:61.00
项目类别:面上项目
4

融合深度学习的水电机组故障知识图谱构建与不确定推理诊断

批准号:51879111
批准年份:2018
负责人:李超顺
学科分类:E0904
资助金额:60.00
项目类别:面上项目