基于融合策略的汉藏(藏汉)机器翻译关键技术研究

基本信息
批准号:61662061
项目类别:地区科学基金项目
资助金额:41.00
负责人:才让加
学科分类:
依托单位:青海师范大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:过芒吉,华却才让,才藏太,周毛先,慈祯嘉措,贡保才让,色差加,桑杰端智,张瑞
关键词:
规则神经网络语言模型实例和模板机器翻译统计
结项摘要

Due to the shortage in Chinese-Tibetan bilingual parallel corpora, it is currently a problem in an urgent need of being researched and solved that how to reach maximum of usage existing language resources and techniques, and effectively combine multiple translation strategies for improving machine translation performance. This project will study Chinese-Tibetan contrasted grammatical information dictionary and rule base construction technology to support rule-based translation method, Chinese-Tibetan bilingual example database extraction and bilingual template library generalization technology to support example-based and templates-based translation method, statistical Chinese-Tibetan machine translation technology considering Tibetan characteristics, LSTM neural machine translation technology for Tibetan related translation, and Chinese-Tibetan machine translation integrated technology based on neural network language model. The project will focus on machine translation methods which can effectually support language with poor resources so as to solve the basic problems in Chinese-Tibetan machine translation, and build a Chinese-Tibetan machine translation system which combine rules-based, examples-based,template-based, statistical and neural methods to markedly improve the quality of Chinese-Tibetan machine translation. The knowledge bases including dictionary library, rule base, example base and template base, as well as language models established by this project will provide reliable data resources and technical support for the future research in the fields related to Chinese-Tibetan machine translation.

由于汉藏平行语言资源十分缺乏,如何最大程度地利用现有的语言资源和技术方法,有效融合多种翻译策略以提高机器翻译系统的性能,成为目前急需研究和解决的问题。本项目将通过研究支撑规则翻译方法的汉藏对照语法信息词典及规则库的构建、实例和模板翻译方法的藏汉双语实例库抽取及双语模板库泛化技术、考虑藏语特点的汉藏统计机器翻译技术、LSTM汉藏神经网络机器翻译技术以及基于神经网络语言模型的汉藏机器翻译融合技术,有效支持资源缺乏语言的机器翻译方法,解决汉藏机器翻译中面临的基本问题,建立基于规则、实例和模板、统计方法以及神经网络模型相融合的汉藏机器翻译系统,显著提高藏汉机器翻译质量。建立的词典、规则、实例和模板等知识库和语言模型将为今后汉藏机器翻译相关领域的研究提供数据资源和技术支持。

项目摘要

由于汉藏平行语言资源十分缺乏,如何最大程度地利用现有的语言资源和技术方法,有效融合多种翻译策略以提高机器翻译系统的性能,成为目前急需研究和解决的问题。本项目将通过研究支撑规则翻译方法的汉藏对照语法信息词典及规则库的构建、实例和模板翻译方法的藏汉双语实例库抽取及双语模板库泛化技术、考虑藏语特点的汉藏统计机器翻译技术、LSTM汉藏神经网络机器翻译技术以及基于神经网络语言模型的汉藏机器翻译融合技术,有效支持资源缺乏语言的机器翻译方法,解决汉藏机器翻译中面临的基本问题。主要成果有:构建藏汉对照语法信息词典,人工校对并完善翻译规则库,抽取并人工校对30万条藏汉双语实例短语库,建立带有Attention机制的双向LSTM机器翻译模型,最终合成一个基于规则、统计方法以及神经网络模型相融合的汉藏机器翻译系统。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
2

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021
3

扶贫资源输入对贫困地区分配公平的影响

扶贫资源输入对贫困地区分配公平的影响

DOI:
发表时间:2020
4

LTNE条件下界面对流传热系数对部分填充多孔介质通道传热特性的影响

LTNE条件下界面对流传热系数对部分填充多孔介质通道传热特性的影响

DOI:10.11949/0438-1157.20201662
发表时间:2021
5

含饱和非线性的主动悬架系统自适应控制

含饱和非线性的主动悬架系统自适应控制

DOI:10.3969/j.issn.1674-0696.2020.10.20
发表时间:2020

才让加的其他基金

批准号:61063033
批准年份:2010
资助金额:33.00
项目类别:地区科学基金项目

相似国自然基金

1

面向汉藏机器翻译的大规模双语语料库构建技术研究

批准号:61063033
批准年份:2010
负责人:才让加
学科分类:F0211
资助金额:33.00
项目类别:地区科学基金项目
2

汉藏双语跨语言语音转换中的关键技术研究

批准号:61262055
批准年份:2012
负责人:甘振业
学科分类:F0211
资助金额:43.00
项目类别:地区科学基金项目
3

基于深度学习的汉藏双语语音合成的研究

批准号:11664036
批准年份:2016
负责人:杨鸿武
学科分类:A2305
资助金额:42.00
项目类别:地区科学基金项目
4

基于本体的多策略民汉机器翻译研究

批准号:61132009
批准年份:2011
负责人:黄河燕
学科分类:F0113
资助金额:280.00
项目类别:重点项目