中文句子语义概念图自动构建方法及应用研究

基本信息
批准号:61462027
项目类别:地区科学基金项目
资助金额:45.00
负责人:钟茂生
学科分类:
依托单位:江西师范大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:王鹏鸣,周娟,曾辉,周洁,廖辉传,王琪,桑迪欢,王小虎,周冬卫
关键词:
语义表示文本复制检测概念图自然语言处理概念语义分析
结项摘要

Conceptual Graph is an extended artificial intelligence knowledge representation method, which is proven to be superior to the classical knowledge representation method. If there is a method to construct automatically semantic conceptual graph for the natural language, which will explore a new way for the natural language processing models. Though there is no feasible solution on how automatically to parse the semantics of the natural language and to construct concept graph up to now. In the project, by connecting closely with the characteristics that the concept of Chinese words is coupling, learning from the ideological that logic reveals the connotations of concept, using the connotation semantic conceptual graph for the knowledge representation framework and using the concept connotation structure<E, A, V> as basic conceptual structure, we present a method of constructing automatically the conceptual graph for the Chinese sentence, which include two steps, that is, the first step of building all <E,A,V> basic conceptual structures of this sentence based on these components, such as the 'Entity', 'Attribute' and 'Value', which are extracted by using the entity extraction and the conceptual relation extraction method based on the template, and the second step of connecting and extending recursively these <E, A, V> basic conceptual structures with the sentence template conceptual graph skeleton by applying some defined operations on concept graph and using the top-down stepwise refinement strategy. At the same time, we will further study automatic construction method of concept graph based on the way of learning from cases in the project. Lastly, we will apply the construction strategy of conceptual graph to the task of the text copy detection for "science and technology achievement awards" application documents. The researching of the project will provide a new way to automatically construct the semantic conceptual graph of Chinese sentences, and has influences on improving the performance of information retrieval, machine translation, text copy detection and so on by building accurately the sentence semantic conceptual graph.

概念图是被证明优于经典的、扩展的人工智能知识表示方法,构建自然语言语义概念图,将为自然语言处理模式探索新的道路。但是如何自动解析自然语言语义和自动构建概念图,还没有切实可行的方案。课题紧密结合汉语词语概念耦合的特点,借鉴逻辑学揭示概念内涵的思想,以内涵语义概念图为知识表示框架,以概念内涵结构<E, A, V>为基本概念结构,用实体抽取和基于模板的概念关系抽取方法来获取句子内部<E, A, V>概念结构,以句子模板概念图为骨架,用定义的概念图基本操作和自顶向下逐步求精策略,递归的将<E, A, V>概念结构连接扩展并构建生成句子语义概念图,同时进一步研究基于示例学习的概念图自动构建方法,最后将概念图构建策略应用于"科技成果奖励"重复申报的文本复制检测。课题的研究将为汉语语义概念图自动构建提供新的思路,准确地构建句子语义概念图,对于改进信息检索、机器翻译、文本复制检测等任务的性能具有重要意义。

项目摘要

概念图是被证明优于经典的、扩展的人工智能知识表示方法,构建自然语言语义概念图,将为自然语言处理模式探索新的道路。但是如何自动解析自然语言语义和自动构建概念图,还没有切实可行的方案。本课题紧密结合汉语词语概念耦合的特点,借鉴逻辑学揭示概念内涵的思想,以内涵语义概念图为知识表示框架,以概念内涵结构<E, A, V>为基本概念结构,对句子概念图的表示、概念图的自动构建、概念图应用等三方面进行了深入研究,项目的主要研究工作包括:. (1)概念图表示研究:以<E, A, V>为基本概念结构为基础,提出了一种适合汉语句子语义表示的汉语内涵语义概念图表示模型ISCG,以及一种融合内涵属性和实体关系的概念图表示方法C-A&R。. (2)概念图自动构建研究:以词典释义的概念内涵分析、术语抽取、关系抽取、机器学习等方法技术为基础,提出了基于词典释义的基本概念图构建方法,基于本体、属性词典和与关系抽取的概念图自动构建方法,以及基于领域文本术语抽取的句子语义概念图分层构建模型。. (3)概念图应用研究:针对“科技成果奖励申报系统”中重复申报的文本复制检测应用背景,提出了一种基于句子概念结构和语义相似度计算的文本相似性检测方法,以及一种基于C-A&R概念图的科技领域文本相似性检测方法;. 基于上述研究工作,课题组取得了如下预期的研究成果:(1)在国内外期刊、学术会议发表论文17篇(其中SCI、EI期刊或会议论文8篇,中文核心期刊论文6篇),另有4篇文章在投稿;(2)培养硕士研究生6名;(3)资助课题组成员33人次参与国内外学术交流,协办会议两次,同时邀请了6位国内外相关研究领域的专家、学者进行学术交流和项目指导。. 课题研究成果将为后续汉语语义概念图自动构建提供新的思路,也为实现汉语自然语言语义理解目标迈出新的一步。同时,构建句子语义概念图,对于改进信息检索、机器翻译、文本复制检测等自然语言处理任务的性能具有重要意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
2

基于综合治理和水文模型的广西县域石漠化小流域区划研究

基于综合治理和水文模型的广西县域石漠化小流域区划研究

DOI:10.14050/j.cnki.1672-9250.2017.02.014
发表时间:2017
3

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
4

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021
5

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

DOI:10.7498/aps.68.20181682
发表时间:2019

钟茂生的其他基金

相似国自然基金

1

中文领域本体学习及半自动构建方法研究

批准号:71201032
批准年份:2012
负责人:于娟
学科分类:G0112
资助金额:19.00
项目类别:青年科学基金项目
2

中文动态语义网构建技术研究

批准号:61272344
批准年份:2012
负责人:赵东岩
学科分类:F0607
资助金额:80.00
项目类别:面上项目
3

中文语义依存分析资源构建及分析技术研究

批准号:61170144
批准年份:2011
负责人:邵艳秋
学科分类:F0211
资助金额:55.00
项目类别:面上项目
4

面向网页检索应用的汉语语义概念图表示方法研究

批准号:60873135
批准年份:2008
负责人:陆汝占
学科分类:F0211
资助金额:30.00
项目类别:面上项目