基于句法结构和语义框架的机器翻译自动评价方法研究

基本信息
批准号:61379086
项目类别:面上项目
资助金额:73.00
负责人:刘群
学科分类:
依托单位:中国科学院计算技术研究所
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:谢军,熊皓,孟凡东,赵红梅,陈宏申,王明轩
关键词:
语义框架相似度自动评价方法机器翻译评价句法结构相似度
结项摘要

Automatic evaluation is not only a very important tool for machine translation research, but also an extremely important guidance for the direction of machine translation research. But almost all the current mainstream automatic machine translation evaluation metrics only consider whether the combination of several neighbour words in candidate translations appears in the reference translations, without the consideration that if the candidate sentence as a whole conform with the habit of human to make a sentence. Such metrics not only result in a low correlation with human evaluations, but also are not benefit to lead the machine translation research to a direct which can generate translations with better syntactic and semantic structures. The proposed project will research on dependency based automatic machine translation metrics. Compared with existing researches on syntactic or semantic based evaluation metrics, our method will only utilize the syntax structure of the reference translation, which will avoid the disadvantage of parsing on the machine translation results, and can obtain better correlations with human evaluation. Compared with existing researches on machine learning based metrics, our methods will have more universal for different natural languages and domains, without the necessary of parameter tuning for specific language and domain. We will also research on the machine translation decoding algorithm and parameter tuning method based on this metrics, which will lead to machine translation results with better syntax and semantic structure.

机器翻译自动评价是机器翻译研究的重要工具,也对机器翻译研究起着极为重要的导向作用。然而目前主流的机器翻译自动评价指标都没有考虑候选译文句子的结构,而是仅仅考虑参考译文的若干个临近词的组合是否出现在候选译文中,因而无法从总体上评判译文句子否符合人的造句习惯。这不仅使得现有的机器翻译指标与人工评价的相关度较低,也不利于引导机器翻译研究,使之趋向于生成更符合句法语义结构的译文。本项目将研究基于依存结构的机器翻译自动评价指标。与现有的基于句法语义的机器翻译评价研究相比,我们将仅利用参考译文的句法结构,避免将句法分析器作用于机器译文的弊端,并获得与人工评价更好的相关性。而与基于机器学习的机器翻译评价方法相比,本方法将具有更好的普适性,可用于任何自然语言和领域,并无需针对特定的语言和领域进行参数训练。我们还将研究基于该指标的机器翻译解码算法和调参方法,从而使之能产生具有更好的句法语义结构的译文。

项目摘要

机器翻译评价是机器翻译研究的关键任务之一。机器翻译评价不仅仅是用于评价机器翻译的好坏,而且引导着机器翻译的研究方向。本课题目标是研究基于句法结构和语义框架的机器翻译评价方法,已达到与人工评价更好的符合度。.本课题总体上完成了预期的目标,部分具体技术方案有调整,部分成果超出预期。.本课题提出了基于句法依存的两种机器翻译评价方法(RED和DPMF)和一种基于译文完整性的机器翻译评价方法(ENTF),这些方法可以更好的机器翻译译文和人工译文在句法依存结构和译文完整性方面的一致性,并且在WMT2014国际机器翻译评测任务中取得了很好的结果。另外,我们还研究了基于深度学习的机器翻译评价方法,发现神经网络方法可以为机器翻译评价提供一个很好的框架。.机器翻译人工评价是机器翻译评价的最终指标。近些年都柏林城市大学(DCU)的Yvette Graham博士对机器翻译人工评价进行了全面系统和深入的分析研究,提出了机器翻译的直接评估(Direct Assessment)方法。该方法已被WMT机器翻译评测采纳为官方的唯一人工评价方法,取代使用了8年之久的RR方法。我们与DCU开展了合作研究,对参考译文对机器翻译人工评价的影响进行了深入研究,通过大量实验研究和数据分析,证明了参考译文的选择并不会对DA方法的结果产生显著性影响。对DA方法的研究做出了贡献。.我们提出了多种基于融合机器翻译评价方法。我们提出了针对DA数据进行训练的融合的机器翻译自动评价方法Blend,采用很少的DA人工评价数据,就可以在各种语言上显著超过任何其他评价方法。该方法在WMT2017的机器翻译评估方法评测中,在大多数语种上都获得了第一名。.本项目发表论文11篇,包括顶级会议论文3篇。所开发的机器翻译评价方法的都以通过GitHub公开了源代码。培养了6名博士生和2名硕士生。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于被动变阻尼装置高层结构风振控制效果对比分析

基于被动变阻尼装置高层结构风振控制效果对比分析

DOI:10.13197/j.eeev.2019.05.95.fuwq.009
发表时间:2019
2

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
3

信息熵-保真度联合度量函数的单幅图像去雾方法

信息熵-保真度联合度量函数的单幅图像去雾方法

DOI:10.3724/SP.J.1089.2019.17435
发表时间:2019
4

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

DOI:10.13191/j.chj.2017.0028
发表时间:2016
5

基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析

基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析

DOI:
发表时间:2017

刘群的其他基金

批准号:31372424
批准年份:2013
资助金额:85.00
项目类别:面上项目
批准号:31730096
批准年份:2017
资助金额:293.00
项目类别:重点项目
批准号:39200096
批准年份:1992
资助金额:4.50
项目类别:青年科学基金项目
批准号:20272008
批准年份:2002
资助金额:20.00
项目类别:面上项目
批准号:60736014
批准年份:2007
资助金额:180.00
项目类别:重点项目
批准号:30871861
批准年份:2008
资助金额:29.00
项目类别:面上项目
批准号:21072027
批准年份:2010
资助金额:36.00
项目类别:面上项目
批准号:39870608
批准年份:1998
资助金额:9.00
项目类别:面上项目
批准号:39770584
批准年份:1997
资助金额:13.00
项目类别:面上项目
批准号:60573188
批准年份:2005
资助金额:23.00
项目类别:面上项目
批准号:81774077
批准年份:2017
资助金额:55.00
项目类别:面上项目
批准号:11901275
批准年份:2019
资助金额:22.00
项目类别:青年科学基金项目
批准号:21572031
批准年份:2015
资助金额:75.00
项目类别:面上项目
批准号:30571391
批准年份:2005
资助金额:27.00
项目类别:面上项目
批准号:30371080
批准年份:2003
资助金额:20.00
项目类别:面上项目
批准号:31672544
批准年份:2016
资助金额:63.00
项目类别:面上项目
批准号:20672019
批准年份:2006
资助金额:28.00
项目类别:面上项目
批准号:81603353
批准年份:2016
资助金额:18.00
项目类别:青年科学基金项目
批准号:30271025
批准年份:2002
资助金额:19.00
项目类别:面上项目
批准号:20872015
批准年份:2008
资助金额:33.00
项目类别:面上项目
批准号:21272034
批准年份:2012
资助金额:80.00
项目类别:面上项目

相似国自然基金

1

基于语言理解的机器翻译译文自动评价方法研究

批准号:61203313
批准年份:2012
负责人:李茂西
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目
2

基于深度句法的统计机器翻译方法研究

批准号:61672138
批准年份:2016
负责人:肖桐
学科分类:F0211
资助金额:16.00
项目类别:面上项目
3

基于句法结构和语义信息的指代消解研究

批准号:61003153
批准年份:2010
负责人:孔芳
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目
4

基于句法结构和篇章结构的统计机器翻译关键技术研究

批准号:61373095
批准年份:2013
负责人:张民
学科分类:F0211
资助金额:79.00
项目类别:面上项目