基于统计的维吾尔语依存句法分析若干关键技术研究

基本信息
批准号:61262061
项目类别:地区科学基金项目
资助金额:43.00
负责人:麦热哈巴·艾力
学科分类:
依托单位:新疆大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:塞买提·买买提敏,阿依克孜·卡德尔,麦合甫热提,塔依尔江·苏拉依曼,刘源,米莉万·雪合来提,萨比尔江·那衣里,米日姑·肉孜
关键词:
树库转换依存语法维吾尔语句法分析
结项摘要

Dependency parsing is a very important part of natural language processing, also is the basis of semantic analysis. Researchers in domestic and overseas have made lots of researches about it ,and have used the results on the other fields. it is promoted the information processing ability of these languages. The Uyghur parsing is just getting started, but it uses phrase based grammer system, dependency parsing research is still in the undeveloed state. Obviously, dependency parsing in Uyghur plays irrepalceble role in the information processing of the Uyghur.On the other hand, Uyghur is a special language- - -it is an agglutinative language where a sequance of inflectional and derivational morphemes get affixed to a root. At syntax level, the constituend orde is SOV- - -undoubtedly, it brings some difficulties to Uyghur dependency parsing.With the intention of serving for futher Uyghur dependency parsing and semantic analysis,the subject focus on studing several important contents ,including the determination of depending unit and dependent types; the method of conversing the phrase based treebank to dependency treebank and the establishment of several common dependency parsing algorythm based on statistical model. Our goal is to build an Uyghur dependency treebank which scale is at least 20,000, and develop Uyghur dependency parsing methods.。

依存句法分析是自然语言处理中很重要的一个研究内容。国内外已有许多研究人员在这方面做了大量的研究,并对语言的深层分析提供了理论基础与技术。维吾尔语句法分析研究才刚起步,主要对短语结构语法体系方面进行了探讨,但还没有涉及到依存句法分析的研究。维吾尔语的特殊性- - -维吾尔语语属于SOV结构,它是典型的黏着性语言,其形态变化丰富、派生能力极强、词尾数量很多,词尾不仅使词干具有新的语法功能,同时搭载着一定的语义信息等- - -无疑给维吾尔语的依存句法分析带来一定的困难。本项目以为进一步加深维吾尔语依存句法分析和维吾尔语语义分析提供研究基础为初衷,着重研究维吾尔语依存句法分析中关键的几个内容,即包括依存单元和依存关系的确定;短语树库与依存树库的转换以及几种常用的依存句法分析统计模型的建立等。最终构建规模至少为2万句的维吾尔语依存树库以及提出适合于维吾尔语言特性的基于统计的依存句法分析方法。

项目摘要

树库建设一直是自然语言处理中非常重要的环节,它为自然语言的信息处理提供有力的研究平台。近年来在国家自然科学基金等项目的支持下,维吾尔语的信息处理也得到了很大的进步,而主要徘徊在词法分析层面上。维吾尔依存树库的建设填补了维吾尔语句法方面的这一空白。此项目中,主要研究了维吾尔语句子的结构特性,制订了维吾尔语依存树中依存关系的类型、标注集、依存标注规范、撰写了依存树库表注手册、设计与实现了依存树库标注工具软件,研究了基于统计的维吾尔语依存句法分析方法、维吾尔语短语树转换维吾尔语依存树的方法以及将维吾尔语依存树库转换成Universal Dependency标准。项目最后创建了规模有2万条维吾尔语句子的树库,并在UD网站上发布了1000条UD规范的依存树。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019
2

生物炭用量对东北黑土理化性质和溶解有机质特性的影响

生物炭用量对东北黑土理化性质和溶解有机质特性的影响

DOI:10.19336/j.cnki.trtb.2020112601
发表时间:2021
3

上转换纳米材料在光动力疗法中的研究进展

上转换纳米材料在光动力疗法中的研究进展

DOI:
发表时间:2017
4

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020
5

基于语义分析的评价对象-情感词对抽取

基于语义分析的评价对象-情感词对抽取

DOI:10.11897/SP.J.1016.2017.00617
发表时间:2017

麦热哈巴·艾力的其他基金

相似国自然基金

1

汉语依存句法分析若干关键技术研究

批准号:60803093
批准年份:2008
负责人:车万翔
学科分类:F0211
资助金额:19.00
项目类别:青年科学基金项目
2

基于依存句法分析的蒙古语语义角色标注及关键技术研究

批准号:61262046
批准年份:2012
负责人:华沙宝
学科分类:F0211
资助金额:46.00
项目类别:地区科学基金项目
3

现代维吾尔语句法分析关键技术的研究

批准号:60963018
批准年份:2009
负责人:艾山·吾买尔
学科分类:F0211
资助金额:21.00
项目类别:地区科学基金项目
4

词汇化句法分析若干关键技术研究

批准号:61262035
批准年份:2012
负责人:袁里驰
学科分类:F0211
资助金额:43.00
项目类别:地区科学基金项目