面向语言处理的藏语概念框架语义知识库构建研究

基本信息
批准号:61866034
项目类别:地区科学基金项目
资助金额:38.00
负责人:多拉
学科分类:
依托单位:西北民族大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:多杰卓玛,赵颖,索南才让,仁青卓么,项见措,仁青加,满拉,扎西
关键词:
知识管理语义知识库知识组织框架语义领域知识库
结项摘要

With the improvement and development of various artificial intelligence algorithms, as well as neural networks, deep learning has become a hot spot, those powerful neural architectures performing in big data processing has made Breakthroughs progress. However, there is still a search in progress for whether if could neglect a large number of specific projects for specific tasks or whether to incorporate more language structures into deep learning. As for a small language, under the circumstance of that data size is too small and the big data is empty, the support and assistance of the Knowledge base will be become a key resource, and the importance will never be replaced. This topic has referenced theories like Frame Semantics, Valence Grammar, Case Grammar, and also referenced Berkeley Frame Net, Word Net by Princeton University's ,and the Mind Net by Microsoft, Beside those ,we also referenced the 905 Semantic Knowledge Engineering, the How Net, the CCD by Peking University (Chinese Concept Dictionary) , Shanxi University English Frame Net and more research methods. The research is based on the Tibetan grammatical theories, to explore the laws and rules of Tibetan the framework of semantic analysis, to adjusting and enriches the methods of Tibetan framework semantic analysis, and to establish the Tibetan frame semantic repository. We set the Tibetan actual text as the study object, for the reason to own a better affection of description and analysis on Tibetan Semantic Framework System, we established Tibetan Words Cell Base, Tibetan Semantic Framework Base, and more Tibetan syntactic knowledge bases for each domain.

随着人工智能各种算法的兴起,神经网络、深度学习等成为热点,在大数据处理中用简单而强大的神经架构执行复杂任务,取得了突破性进展。但在是否可以忽略大量针对特定任务的特征工程,或是否将更多的语言结构融入深度学习方面仍在探索。就小语种而言,在没有大数据的情况下知识库的支撑和协助成为一个关键资源,其重要性不可替代。本课题借鉴框架语义学、依存语法、格语法等理论,参考FrameNet、WordNet、MindNet和我国的905语义知识工程、HowNet、北大CCD及山西大学汉语框架语义知识库等的研究方法,立足藏语语法理论,探索藏语框架语义分析的规律,调整充实藏语框架语义系统分析方法,建立藏语概念框架语义资源库。以藏语真实文本为研究对象,建立各个域的藏语词元库、语义框架库、句法知识库,从而对藏语概念框架语义系统进行描写与分析。该资源库的建成将为藏语句法分析、语义理解、文本理解、智能检索等发挥关键作用。

项目摘要

本课题借鉴框架语义学、依存语法、格语法等理论以及迁移学习前沿方法,立足藏语语法虚词理论,探索藏语依存语法、框架语义分析的规律,调整充实藏语框架语义系统分析方法和藏语依存知识表示方法,融合藏语语法知识,利用深度学习方法在数据预处理、无监督、半监督、双语迁移学习等方法构建依存树库、框架知识库等,取得了一定的成效。.在理论层面,项目在句法语义标记体系建构方面,不仅考虑了不同语种的依存和框架语义模式,同时创新性利用了藏语固有的语法特点,将虚词融入句法、语义两个层面并对其赋予架构作用和一致性鲁棒作用,成效显著。.在方法层面,项目在初期依存数据集建构方面,不仅利用人工进行探索性标注,同时利用虚词知识库和虚词功能作用自动建构前期粗标注数据集,并进行人工审校后利用神经网络方法进行语言建模,从数据收集、预处理、半监督数据到有监督数据建构,研究呈体系化,具有一定的创新性。.在资源方面,项目最终建成多个知识库和5万句依存树库、框架语义知识库,该树库是目前国内最大的藏语依存树库。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
5

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017

多拉的其他基金

批准号:61262053
批准年份:2012
资助金额:45.00
项目类别:地区科学基金项目

相似国自然基金

1

维吾尔语框架语义知识库构建技术的研究

批准号:60763006
批准年份:2007
负责人:阿里甫·库尔班
学科分类:F0211
资助金额:18.00
项目类别:地区科学基金项目
2

面向自然语言处理的逻辑语义表达与演算模型研究

批准号:60173025
批准年份:2001
负责人:王惠临
学科分类:F0211
资助金额:18.00
项目类别:面上项目
3

藏语语义本体的概念识别和上下位关系获取技术研究

批准号:61103161
批准年份:2011
负责人:邱莉榕
学科分类:F0211
资助金额:21.00
项目类别:青年科学基金项目
4

面向对象语言的语义模型研究

批准号:69283003
批准年份:1992
负责人:李师贤
学科分类:F0201
资助金额:4.00
项目类别:专项基金项目