Along with the fast development of Internet, how to extract veridical contents from text becomes a huge challenge we need to resolve in natural language understanding. As one of the fundamental researches in natural language understanding, event veridicality judgment can be widely applied to various critical tasks such as information extraction and question answering. This project will systematically study event veridicality judgment in natural language understanding with focus on the information lack and global optimization problems. The contributions of this project include: 1) According to the discourse rhetorical structure theory, it proposes an event veridicality judgment method based on correlated event detection, to solve the information lack problem; 2) Inspired by the relevant theories on psycholinguistics, it proposes an event veridicality judgment method based on the event source assessment mechanism, to solve the false event detection problem; 3) It proposes an event veridicality propagation network based on probabilistic graphical model, to achieve global optimization in event veridicality judgment. The project is critical to explore the general cognitive mechanism of human language understanding and to promote the specific development of event veridicality judgment.
随着互联网的快速发展,如何从文本信息中获取真实的内容成为自然语言理解必须解决的一个重大挑战。事件真实性判别作为自然语言理解领域的一项基础研究,可以广泛应用于信息抽取、自动问答等核心任务。本课题将系统深入地研究自然语言理解中事件真实性判别方法,重点解决其信息缺乏和全局优化两大问题。本课题主要特色如下:1)根据篇章修辞结构理论,提出基于关联事件检测的事件真实性判别方法,解决信息缺乏的问题;2)受心理语言学相关理论启发,提出基于事件信息源评价机制的事件真实性判别方法,解决虚假事件的判别问题;3)提出基于概率图模型的事件真实性全局优化策略,融合事件描述真实性、关联事件真实性和事件信息源可信度等多个层面因素,全局优化事件真实性判别性能。本课题对于探索自然语言理解的认知机理,推动事件真实性判定研究具有重要的科学意义。
随着互联网的快速发展,如何从文本信息中获取真实的内容成为自然语言理解必须解决的一个重大挑战。事件真实性判别作为自然语言理解领域的一项基础研究,可以广泛应用于信息抽取、自动问答等核心任务。本课题将系统深入地研究自然语言理解中事件真实性判别方法,重点解决其信息缺乏和全局优化两大问题。主要研究成果包括:1)提出了基于BiLSTM-CRF神经网络框架的否定与不确定信息识别与抽取方法,该方法能够充分利用上下文信息并抓取全局特征;2)建立了汉语否定聚焦点标注规范,并构建了一个包含4000多个实例的汉语否定聚焦点识别数据集(CNeF1.0);3)提出了基于语言特征(真实性线索词、事件极性、时态)和注意力机制的句子级和篇章级事件真实性检测方法。本课题支持产生的成果较丰硕,包括发表科技文献XX篇,形成否定聚焦点识别标注体系一套,构建数据集一套,为事件真实性判别相关研究奠定了扎实的理论、资源及技术基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
融合自然语言处理的深度视觉理解关键技术研究
自然语言理解及正文生成技术研究
基于事件的图文数据阅读理解关键技术研究
交通视频中车辆行为理解与异常事件感知关键技术研究