短语结构句法分析的核心思想是识别句子中的短语以及短语之间的句法关系。短语结构句法分析一直以来都是自然语言处理领域的核心问题之一。近年来,随着大规模人工标注树库的出现,数据驱动的句法分析器在实际应用中起到重要作用。本申请课题在深入分析短语结构句法分析研究中存在的一些问题的基础上,重点研究移进-归约句法分析的一些关键问题和改进技术。主要研究内容包括:在移进-归约算法框架下引入短语信息、子树级移进-归约算法、挖掘深层次的句法信息、利用预测信息指导移进-归约方法的解码技术、利用异构树库和不带标数据、句法分析的领域适应性。最终集成这些关键技术,构建基于移进-归约的中文句法分析共享支撑平台。
本课题研究渐进式中文句法分析的关键技术,设计并实现了中文语言分析器。为文本处理等其他应用提供了很好的技术支持。研究内容主要包括利用大规模数据词汇依存关系改进移进-归约成分句法分析、多维度等级评分模型优化技术、向上学习方法改进移进-归约中文句法分析、easy-first中文词性标注和依存句法分析、基于特征方法的树库转换技术、Niuparser开源语言分析技术平台构建等关键技术,最后集成所有关键技术构造一套中文句法语义分析系统NiuParser,目前已经公开发布,供学术界无偿使用。本课题相关研究成果在国内外期刊杂志和学术会议上发表了8篇学术论文,其中包括2篇国际期刊和3篇Acl/Coling顶级国际会议论文。
{{i.achievement_title}}
数据更新时间:2023-05-31
智能煤矿建设路线与工程实践
濒危植物海南龙血树种子休眠机理及其生态学意义
基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演
区块链技术:从数据智能到知识自动化
偏正态数据下混合非线性位置回归模型的统计诊断
汉语依存句法分析若干关键技术研究
词汇化句法分析若干关键技术研究
中文专利检索中关键技术研究
中文句法分析与语义角色标注的联合学习机制研究