面向词汇功能的学术文本语义识别与知识图谱构建

基本信息
批准号:71473183
项目类别:面上项目
资助金额:66.00
负责人:陆伟
学科分类:
依托单位:武汉大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:孙永强,曾子明,王平,程齐凯,黄永,武川,杨海峰
关键词:
信息检索文本挖掘数字图书馆知识工程信息组织
结项摘要

Nowadays,scientists take use of scholar search engine (Google Scholar, SCI, etc.) and informatics tools to find scholar information. However, these tools and the methods behind them cannot address some basic but also important questions such as: "Is term 'Data Mining' a kind of technique the paper takes or topic the paper focus on?", "What methods were developed to solve a particular problem according to these papers?", "Who is the one proposed this research topic for the first time?", "What does the term 'state of the art' in a paper refer to?". This subject aims to develop a suit of theories, methods and tools to help scientists to find the answers of the questions listed above in a fast and convenient way. The core component of this subject is to identify the functionality of mentions in research paper. We try to build a semantic framework to define the functions of term and the relations between terms, and propose some methods to address problems such as term function identification, relation extraction, coreference resolution, concept evolution identification. Thus this subject chooses some research domain to build a functionality oriented scientific research knowledge graph. This subject is of significant academic and practical value. The methods and knowledge graph can be used to improve the performace of scholar search engine and enhance the semantic leve of academic text analysis. This subject have also potential value in automatic summarization, knowledge management, et.al.

当前,科研人员难以通过学术搜索引擎和科学计量工具快速回答一些基本但重要的问题,如:"数据挖掘在某文献中是方法还是主题?"、"某问题有哪些技术可解决"、"某问题最早由哪篇文献提出"、"文献中所指的state of the art具体是什么?" 本课题着眼于学术文本词汇功能识别这一核心任务,构建一套理论、方法和工具,帮助科研人员快速回答上述问题。本课题试图对学术文本中词汇功能及词汇间语义关系进行建模,探索自动化方法以识别词汇的功能(技术、主题、领域等);建立词汇语义关联;实现学术词汇的指代消解,分析概念的演化脉络;在此基础上,构建面向词汇功能的知识图谱。 本研究具有较大的理论与应用价值。提出的技术方法及构建的知识图谱可以用于提升学术搜素引擎搜索结果的质量,改进学术文本分析效果,提升相关应用的语义化水平,还可以广泛应用于自动摘要、知识管理等各个领域。

项目摘要

本课题着眼于学术文本词汇功能识别这一核心任务,构建一套理论、方法和工具,帮助科研人员快速回答上述问题。本课题试图对学术文本中词汇功能及词汇间语义关系进行建模,探索自动化方法以识别词汇的功能(技术、主题、领域等);建立词汇语义关联;实现学术词汇的指代消解,分析概念的演化脉络;在此基础上,构建面向词汇功能的知识图谱。本研究提出的技术方法及构建的知识图谱可以用于提升学术搜索引擎搜索结果的质量,改进学术文本分析效果,提升相关应用的语义化水平,还可以广泛应用于自动摘要、知识管理等各个领域。. 围绕学术文本的词汇功能语义、多粒度概念抽取、词汇功能识别和词汇功能维度的知识图谱等专题,发表论文被SSCI/SCIE索引1篇,EI索引1篇;领域权威期刊论文、核心期刊论文18篇左右;完成了专著1本;构建了计算机领域词汇语料库1个,开发了学术文本语义分析工具集4个;申请相关专利4项;获得国家级奖励1项,省部级奖励1项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

妊娠对雌性大鼠冷防御性肩胛间区棕色脂肪组织产热的影响及其机制

妊娠对雌性大鼠冷防御性肩胛间区棕色脂肪组织产热的影响及其机制

DOI:
发表时间:
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

信息熵-保真度联合度量函数的单幅图像去雾方法

信息熵-保真度联合度量函数的单幅图像去雾方法

DOI:10.3724/SP.J.1089.2019.17435
发表时间:2019
4

组蛋白去乙酰化酶在变应性鼻炎鼻黏膜上皮中的表达研究

组蛋白去乙酰化酶在变应性鼻炎鼻黏膜上皮中的表达研究

DOI:10.16066/j.1672-7002.2021.06.013
发表时间:2021
5

强震过程滑带超间隙水压力效应研究:大光包滑坡启动机制

强震过程滑带超间隙水压力效应研究:大光包滑坡启动机制

DOI:
发表时间:2020

陆伟的其他基金

批准号:51574279
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:50804022
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:81673018
批准年份:2016
资助金额:61.00
项目类别:面上项目
批准号:51671146
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:31560652
批准年份:2015
资助金额:42.00
项目类别:地区科学基金项目
批准号:U1933112
批准年份:2019
资助金额:37.00
项目类别:联合基金项目
批准号:30901348
批准年份:2009
资助金额:27.00
项目类别:青年科学基金项目
批准号:91859110
批准年份:2018
资助金额:70.00
项目类别:重大研究计划
批准号:71173164
批准年份:2011
资助金额:45.00
项目类别:面上项目
批准号:71673211
批准年份:2016
资助金额:51.00
项目类别:面上项目
批准号:31570081
批准年份:2015
资助金额:25.00
项目类别:面上项目
批准号:50901052
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:51071109
批准年份:2010
资助金额:40.00
项目类别:面上项目

相似国自然基金

1

矿床领域文本数据挖掘与知识图谱构建

批准号:41902305
批准年份:2019
负责人:王成彬
学科分类:D0215
资助金额:27.00
项目类别:青年科学基金项目
2

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

批准号:U1504612
批准年份:2015
负责人:熊晶
学科分类:F0607
资助金额:27.00
项目类别:联合基金项目
3

面向特定领域的知识图谱构建与应用关键技术研究

批准号:U1836118
批准年份:2018
负责人:程军军
学科分类:F0606
资助金额:65.00
项目类别:联合基金项目
4

面向资源型社交网站的知识图谱构建方法研究

批准号:61402220
批准年份:2014
负责人:欧阳纯萍
学科分类:F0607
资助金额:24.00
项目类别:青年科学基金项目