在统计机器翻译中,除了语料库的规模之外,如何充分利用语料库至关重要。典型的机器翻译方法,其基本假设是:语料库中的句对都是高质量的翻译对,且句对之间互相独立,该假设过于严格。因此,本课题将针对此问题进行深入研究,试图放松该假设的强约束,基本思路是:基于图构造语料库中句对或者句子之间的内部联系,利用形成的拓扑结构,研究如何提高翻译模型的质量和解码的质量。具体包括:1、基于图的语料库质量评价模型和优化方法研究,力求使得高质量的句对在训练翻译模型时获得更大的比重,以提高翻译模型的质量;2、基于图的语料库选择方法研究,确保获得语料库的完备集合,保证翻译质量的同时,耗费最少的计算或人工翻译等资源;3、基于图的解码方法研究,利用语料库的内部结构来指导解码的完成,提高翻译的质量。本课题将阐明语料库的拓扑结构对机器翻译的影响机制,给出基于图的语料库优化和选择算法以及解码算法,形成基于图的统计机器翻译框架。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
基于混合优化方法的大口径主镜设计
变可信度近似模型及其在复杂装备优化设计中的应用研究进展
基于深度句法的统计机器翻译方法研究
基于短语结构转换模板的统计机器翻译方法研究
基于词汇语义的统计机器翻译研究
基于句子语义结构的统计机器翻译研究