Pseudo event relation is a kind of relation which diverges or even deviates from objective laws, generating in the knowledge architecture triggered by subjective thinking and spreading in the procedure of information description and transmission with language as carrier. It includes three characteristics: confusing, ambiguous and illogical relationship. Correspondingly, pseudo event relation detection is an important subject in the cross-domain of natural language understanding and social opinion analysis, having a high research value in resolving the semantics and pragmatics of language description for event relation as well as discerning truth on the relation within social opinion. Current research on the fundamental theories of pseudo event relation has not started yet and corresponding technologies for detecting such event relation has no presence. For this, we build a framework for pseudo event relation detection on the basis of discourse relation understanding with focus on the characteristics of such pseudo event relations, under which, we study various tasks such as relevant event identification, relation cue mining, confusing event relation detection, ambiguous relation detection and illogical relation detection. Especially, we focus on exploring the key techniques on multiple cues fusion based confusing event relation detection, argument-focus co-reference based ambiguous event relation detection, and illogical event relation detection under the restriction of global event network, by which to implement an automatic scheme of identifying and detecting pseudo event relation in social opinion.
伪事件关系是一种偏离或违背客观规律的事件关系,衍生于主观思维触发的知识体系,繁殖于以语言为载体的信息表述与传播过程,具有关联混淆、关系歧义与逻辑混乱三种特性。伪事件关系检测是自然语言理解与舆情信息分析交叉领域的重要课题,对于解析自然语言描述事件关系时的语义和语用规律,以及辨识舆情信息中事件关联逻辑的真伪,都具有重要的研究价值。目前,针对伪事件关系的理论研究尚未开展,相应的检测技术也属空白。针对这一现象,本课题以篇章关系理解为理论基础,以伪事件关系的语言特性为重点分析对象,形成伪事件关系检测的任务体系,并相应地对如下关键问题予以研究:关联事件识别、关系线索挖掘、混淆事件关系、歧义事件关系和伪逻辑事件关系检测。特别是研究利用多线索融合的事件混淆关系检测;利用同指焦点的事件歧义关系检测和基于全局关联脉络约束的事件伪逻辑关系检测三项关键技术。目标是实现针对舆情的伪事件关系自动识别与检测。
事件关系识别(分类)是一项全新的研究课题,其目标是对自由文本中的事件表述进行分析,确定不同事件之间的关系类型,本课题申请过程中以事件的真伪关系为研究重点,实际执行过程中,增设了更为复杂多样的语义关系(比如,因果,条件,让步,扩展,抽象-实例,对比等)。研究内容涉及1)事件自动抽取技术;2)论元关系识别基础理论与技术;3)多类型事件关系分类技术;4)实体关系识别技术。其中,实体关系识别为研究过程中单独形成的子课题,旨在利用作为事件主要成分的实体、角色和关系,辅助事件的抽取和关系的分析。本课题产生特色技术多项,包括1)集成对抗机制的事件抽取方法(在国际标准评测数据上性能已达70%以上,现居国际领先地位);2)基于平行推理框架的无监督论元关系分析技术(无监督技术具有较高实用性);3)结合了文本特征和图像特征的场景表示,以及在此基础上的事件关系分类方法(融入图像特征极大拓宽了研究手段的可选范围);4)基于实体搜索、关系定义表示学习和实体-事件联合抽取模型的实体关系分类方法(为事件关系和实体关系的混合网络架构及其应用提供支撑)。本课题支持产生的成果较丰硕,包括发表科技文献近50篇,授权发明专利4项,形成国际认可的事件关系体系和标注标准一套,在框架语义网文档级样例和ACE数据集上标注事件关系,形成数据集各一套,构建标注平台在线和离线版各一套,事件抽取系统一套,基于事件关联性的舆情分析内测和实用系统各一套。此外,相应成果支撑重点项目申请一项,相关技术获得江苏省科学技术进步三等奖一项。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于图卷积网络的归纳式微博谣言检测新方法
基于关系对齐的汉语虚词抽象语义表示与分析
基于卷积神经网络的链接表示及预测方法
基于网格模型的导航道路图渐进式化简方法
基于主述位理论的汉语基本篇章单元识别
鲁棒的非特定环境声学事件检测关键技术研究
社交网络中基于短文本的事件检测与分析理论及关键技术研究
音频事件检测技术研究
基于毫米波雷达的睡眠呼吸事件检测关键技术研究