为了应对信息爆炸带来的挑战,迫切需要一些自动化的技术帮助人们在海量数据中迅速找到自己真正需要的信息。信息抽取技术在自然语言处理领域正越发地体现出它的重要性。本课题将对信息抽取的关键支撑技术,即关系抽取任务,进行深入研究,指导计算机从自由文本中自动识别出实体之间的关系。当前国际上更多的是针对有监督学习的关系抽取技术的研究,这种技术通过训练样本的学习获得抽取模式,实现特定领域的关系抽取功能,因而需要对该知识领域较熟悉的人根据事先约定的规则来标记训练样本,同时需要足够数量的训练数据才能保证系统的抽取质量。为此,本课题积极探索面向开放领域的自动关系抽取技术,提出用多知识融合的手段来构建关系候选,建立基于图的关系抽取模型,并充分利用很容易获得的未标签样本的信息,在该图模型上进行非监督的学习,解决手工标注样本的困难,使其在各应用领域中都可扮演重要的角色,也为下一代基于自动问答的搜索引擎的发展奠定基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展
基于多色集合理论的医院异常工作流处理建模
长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移
面向开放网络数据的多元关系抽取、表示与推理研究
面向开放域知识网络的实体语义关系抽取方法研究
开放域语义关系抽取、表示和计算关键技术研究
面向农业领域的维汉双语术语抽取的关键技术研究