藏语词法句法联合分析理论与方法研究

基本信息
批准号:61602387
项目类别:青年科学基金项目
资助金额:20.00
负责人:万福成
学科分类:
依托单位:西北民族大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:马宁,何向真,李亚超,孟祥和,李艾林,李成龙,当增扎西,武焕勤
关键词:
命名实体联合分析短语结构词法分析句法分析
结项摘要

Tibetan Lexical Parsing and Syntactic Parsing are important tasks in Tibetan Information Processing. From the early results, it shows that two tasks are relatively independent of each other, and the Tibetan syntactic analysis research mainly on dependency structure, less in the research of phrase structure. In our research, we based on Tibetan phrase syntax for the first time, build Tibetan phrase syntactic Treebank, using linguistic features like Tibetan syllables and hierarchical named entity to study the Tibetan lexical syntactic integration based on Tibetan phrase syntactic Treebank. In addition, we combined two relatively independent tasks together to explore the new ways of Tibetan Lexical Parsing and Syntactic Parsing, in order to improve accuracy of Tibetan Word segmentation, Named Entity Recognition and Syntactic Parsing.

藏语词法分析、句法分析是藏文信息处理的重要任务,前期研究成果表明,两个任务都是彼此相对独立的,而且在藏文句法分析方面主要以依存结构为主,短语结构相对较少。本研究首次以藏语短语句法为基础,构建藏语短语句法树库,在藏语短语句法树库的基础上,采用融合藏语音节、层次级命名实体等语言学线索特征对藏语词法句法一体化分析进行研究,将两个相对独立的任务联合起来进行分析,探索藏语词法分析和句法分析的新方法,对藏语分词、命名实体识别,句法分析准确率的提升提供一种新的思路。

项目摘要

藏语词法分析、句法分析是藏文信息处理的重要任务,前期研究成果表明,两个任务都是彼此相对独立的,而且在藏文句法分析方面主要以依存结构为主,短语结构相对较少。本项目首次以藏语短语句法为基础,构建藏语短语句法树库,在藏语短语句法树库的基础上,采用融合藏语音节、层次级命名实体等语言学线索特征对藏语词法句法一体化分析进行研究,将两个相对独立的任务联合起来进行分析,探索藏语词法分析和句法分析的新方法,对藏语分词、命名实体识别,句法分析准确率的提升提供一种新的思路。.藏语词法句法联合分析,也可以称为藏语词法句法一体化研究,以藏语本体词法、句法为基础,融合音节序列特征、命名实体特征、句法特征进行一体化分析,主要研究内容包括以下两个方面:一,研究藏语非词汇化短语句法分析方法,构建藏语短语句法树库;二,在藏语短语句法分析基础上,融合命名实体特征、藏语音节特征,研究藏语词法句法一体化分析方法。.统计模型中引入更多有用的文本信息可以优化模型,将藏语分词、句法分析和命名实体识别任务联合起来对于模型的训练是有帮助的。首先,藏语句法结构信息和命名实体结构信息对于藏语分词是有用的特征;其次,藏语命名实体结构可以帮助提升藏语句法分析的性能;最后,藏语分词信息和句法结构信息对于准确识别藏语命名实体也能起到重要作用。藏语的词法句法联合分析模型将成为解决词法分析、句法分析一些瓶颈问题的关键途径,对未来的藏语自然语言处理特别是基础研究以及应用方面产生深远影响。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于被动变阻尼装置高层结构风振控制效果对比分析

基于被动变阻尼装置高层结构风振控制效果对比分析

DOI:10.13197/j.eeev.2019.05.95.fuwq.009
发表时间:2019
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
4

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
5

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

DOI:10.13191/j.chj.2017.0028
发表时间:2016

万福成的其他基金

相似国自然基金

1

汉语词法与句法结构的统一分析

批准号:61202162
批准年份:2012
负责人:李中国
学科分类:F0211
资助金额:23.00
项目类别:青年科学基金项目
2

基于树到串藏语句法翻译若干关键技术研究

批准号:61363055
批准年份:2013
负责人:华却才让
学科分类:F0211
资助金额:45.00
项目类别:地区科学基金项目
3

中文句法分析与语义角色标注的联合学习机制研究

批准号:60970056
批准年份:2009
负责人:朱巧明
学科分类:F0211
资助金额:32.00
项目类别:面上项目
4

老挝语词法分析及老-汉双语平行语料抽取方法研究

批准号:61662040
批准年份:2016
负责人:周兰江
学科分类:F0211
资助金额:39.00
项目类别:地区科学基金项目