Machine reading comprehension aims to answer questions based on the understanding of a given document. It is an important way to evaluate whether a machine can truly understand human language, and plays a very important role in the field of artificial intelligence. The current machine reading comprehension systems are mainly data-driven and focus on the inflexible learning of text matching patterns, while lack the guidance of commonsense knowledge and related semantic reasoning techniques. Therefore, the systems are prone to the interference of noise, and cannot answer the complicated questions. In this project, we aim to study the techniques of machine reading comprehension driven by commonsense knowledge. The techniques will simulate the behavior of human beings in the process of reading comprehension, and flexibly invoke relevant commonsense knowledge to strengthen the understanding of the deep semantics of texts. Then, the corresponding commonsense-enhanced semantic reasoning is performed to obtain the final answer. Specifically, we expect to break through in the following key technologies: (1) commonsense retrieval based on pseudo-relevance feedback; (2) commonsense representation based on context perception; (3) commonsense adapter based on reward mechanism; (4) semantic reasoning engine enhanced by commonsense. Relevant research results will greatly improve the performance of existing machine reading comprehension systems, and will also provide a good support with algorithms and techniques for text understanding and semantic computing in related fields.
机器阅读理解旨在让机器根据对给定文本的理解来回答问题,这是一种评测机器是否真正理解人类语言的重要方式,在人工智能领域处于十分重要的地位。目前的机器阅读理解系统主要基于数据驱动,侧重对文本匹配模式的机械学习,缺乏常识性知识的引导和相关语义推理能力,因此容易受到噪声干扰,也无法回答一些复杂的问题。本项目拟研究常识性知识驱动的机器阅读理解技术,模拟人在阅读理解过程中的行为,灵活调用相关的常识性知识,加强对文本深层语义的理解,并进行常识增强的语义推理,从而得到最终答案。具体来讲,本项目将实现以下几个关键技术的突破:(1)基于伪相关反馈的常识检索方法;(2)基于上下文感知的常识表示方法;(3)基于奖赏机制的常识适配器;(4)基于常识增强的语义推理引擎。相关的研究成果将极大地提升现有机器阅读理解系统的性能,也为相关领域的文本理解和语义计算提供很好的算法和技术支持。
当前机器阅读理解系统主要基于数据驱动,侧重对文本匹配模式的机械学习,缺乏常识性知识的引导和相关语义推理能力,因此容易受到噪声干扰,也无法回答一些复杂的问题。根据前期研究目标,本项目围绕常识获取、常识验证与解释、常识表示及适配以及常识增强的语义推理四个方面展开了广泛深入的研究,显著提升了机器阅读理解能力,且可以拓展到其他相关任务中。具体来讲,主要包括以下几个研究内容:1)在常识获取方面,针对常识不显式表达的隐秘性和在现有知识库中的低覆盖率,提出相关的隐式常识抽取和生成方法,为后续应用提供丰富的知识来源;2)在常识验证和解释方面,提出面向错误常识的解释判断与生成联合学习框架,有效减少了伪常识带来的噪声和错误指引,保障了常识的高质量和可信度;3)在常识表示和适配方面,提出一种基于多模态融合的常识表示及适配方法,有助于实现不同模态的常识对齐,缩小与下游任务之间的语义鸿沟,极大程度地保证当前所用常识的相关性和有效性;4)在常识增强的语义推理方面,分别提出融合上下文和操作流程常识的阅读理解和基于提示学习与细粒度对比学习的低资源常识问答方法,通过构建新型流程类常识库和诱导大规模预训练模型中的常识,显著提升了语义推理能力。.本项目在执行期内取得了丰富的研究成果,完成了预期目标,积累了大量常识、阅读理解和问答数据资源,开发了多套常识性知识驱动的机器阅读理解原型系统。通过对上述研究,不仅提升了现有机器阅读理解系统的性能,也为其他任务中常识的融合和应用提供了相关算法和技术支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
服务经济时代新动能将由技术和服务共同驱动
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
常识性知识的实用研究
基于证据链的可推理机器阅读理解关键技术研究
阅读理解与认知资源优化
面向复杂问题的汉语阅读理解研究