基于证据链的可推理机器阅读理解关键技术研究

基本信息
批准号:61906217
项目类别:青年科学基金项目
资助金额:24.00
负责人:余建兴
学科分类:
依托单位:中山大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
机器阅读理解自动问答语义结构推理问题证据链
结项摘要

Machine comprehension is one of the hot research topics in natural language processing. This task focuses on the research for machine's understanding on the semantics in natural language. It requires the machine to be able to generate the corresponding answers according to the input questions with regards to a given document. Traditional methods often choose the answer by computing the similarity between question-answer pair and the document. Due to the lack of the fine-grained inference process, these methods have minimal capability to link related supports distributed across multiple sentences for deducing the answers. We observe that such linked relations are mainly embodied in the text semantic structure, includes sequential, syntactic, logical and rhetoric structures, etc. Thus, we in this project intend to study the methods for constructing the evidence chain by leveraging the text semantic structure, and using the evidence chain to improve the machine's deeply reasoning ability on the text meanings. The main researches on this project include: (1) we investigate a model to effectively represent the text semantic structure; (2) we employ an approach to interpret the question details, so as to fully grasp the intentions of the questioners; (3) we propose an end-to-end inferential network to construct evidence chain by simultaneously capturing the text semantic structure and question details, and explore the terminated mechanism as well as the accelerated training technique on the network. Finally, we intend to achieve breakthroughs on this research topic for publishing papers with cutting edge results.

机器阅读理解是自然语言处理领域的研究热点之一。该任务侧重于机器对于自然语言语义理解的研究,它要求机器能够根据输入的问题在给定的文档中解答出对应的答案。传统的方法通常是计算问题答案对与文档之间的相似度来进行答案选取。由于缺少细粒度的推理过程,这些方法未能有效地关联分散在不同句子之间的相关内容来推理出答案。我们发现这些关联信息主要体现在文本的语义结构中,包括次序、语法、逻辑和修辞等结构。本项目拟研究利用文本语义结构建立证据链的方法,并基于证据链来提高机器对于文本深层次的语义推理能力。主要研究内容包括:(1)拟研究能有效地表示文本语义结构的模型;(2)拟构建模型解析问题细节来充分地把握提问者本意;(3)拟提出可推理的神经网络通过结合语义结构和问题细节来建立证据链,并研究对应的推理终止机制和加速训练方法。最后,拟在本课题上取得突破以发表具有国际领先水平的研究成果。

项目摘要

本项目主要研究面向语言智能的机器阅读理解和推理技术。该课题在信息检索、智慧教育等应用中具有广泛的商业价值。由于语言存在歧义性、语义模糊性和上下文依赖性,传统基于确定性原理设计的机器很难直接对抽象的非确定性语义建模,存在“表征浅层、推理低阶和资源稀缺”等挑战。项目围绕着这些难点展开了系统的研究,在本项目资助下,研发出一批关键技术,包括提出了基于语义结构的表征方法,解决了知识发现和表示难题;提出了基于协同复合的关联推理技术,揭示了知识归纳和关联推理的规律,大幅提升了对话问答的质量;还提出了基于知识引导的推理生成方法,缓解了稀缺标注资源的过度依赖难题;这些工作于 IEEE Transactions 和中国计算机学会推荐的 A 类等重要期刊和国际会议上发表论文11篇,包括 IEEE TKDE 等国际知名期刊及 ACL、WWW、ICDE、AAAI、IJCAI等国际著名会议;曾多次获得广东省计算机学会优秀论文一等奖,还获得2021年广东省计算机学会科学奖;超额完成了原计划书中预期目标。在知识产权方面,项目组申请了 8件发明专利,其中有 2 件已经授权。这推动成果的产业化应用,譬如本项目的技术可以用于智慧教育实现面向考试的机器自动命题。此外,在人才培养方面,培养6 名在读研究生。这些成果还在中国计算机大会,全国知识图谱与语义计算大会等国内影响力很大的学术会议上做专题报告,具有相当的影响力。这些工作有力地推动了语言智能的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

余建兴的其他基金

相似国自然基金

1

基于事件的图文数据阅读理解关键技术研究

批准号:61806117
批准年份:2018
负责人:王元龙
学科分类:F0606
资助金额:25.00
项目类别:青年科学基金项目
2

基于问题预测和文本生成的阅读理解关键技术研究

批准号:61876009
批准年份:2018
负责人:李素建
学科分类:F0606
资助金额:64.00
项目类别:面上项目
3

基于机器协同与理解的可重构智能工业网络理论及关键技术研究

批准号:51805143
批准年份:2018
负责人:孟召宗
学科分类:E0510
资助金额:25.00
项目类别:青年科学基金项目
4

常识性知识驱动的机器阅读理解研究

批准号:61906045
批准年份:2019
负责人:陈琴
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目