统计机器翻译中的参数学习问题研究

基本信息
批准号:61672277
项目类别:面上项目
资助金额:62.00
负责人:陈家骏
学科分类:
依托单位:南京大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:黄书剑,张建兵,陈华栋,周浩,伊力亚尔·加尔木哈买提,季红洁,李小婉,赵程绮,鲍宇
关键词:
非线性模型参数学习参数估计翻译评价结构化学习
结项摘要

The learning process of statistical machine translation includes defining the representation of parameters and perform parameter estimation according to a certain translation quality evaluation metric, with a certain machine learning method. We interpret this whole process as a process of parameter learning. The parameter learning process has a direct impact to the machine translation quality. As a result, the research on the parameter learning process plays a crucial part in the research of statistical machine translation. On the other hand, machine translation is a special instance of the structured prediction tasks. The research progress on the parameter learning for machine translation will also promote related research in machine learning and data mining areas. This proposal plans to conduct research from three perspectives of the parameter learning, namely parameter modeling, translation evaluation and learning method. The aim of the project is to study a extendible and structured parameter learning framework for machine translation, which includes extendible and nonlinear parameter modeling methods, translation quality evaluation metrics and parameter estimation strategies suitable for this special structured prediction task.

统计机器翻译的学习过程实际是遵照机器翻译问题的特点和规律对参数进行定义,并根据一定的翻译质量评价标准,采用一定的机器学习方法从训练数据中对参数进行估计的过程。本项目从参数学习的角度看待这个过程,将整个过程称为参数学习过程。参数学习过程对提高机器翻译的翻译质量有着直接而重要的影响,是探索高质量机器翻译的必须解决的重要问题。同时,因为机器翻译是一类特殊的结构化学习问题,这类问题的参数学习研究也为机器学习和数据挖掘领域的研究提出了新的挑战。本项目的研究试图从参数建模、翻译评价、学习方法三个方面重新思考统计机器翻译问题,研究可扩展的非线性参数建模方法,适合参数学习的翻译评价标准以及与之相适应的结构化学习策略,从而形成一套可扩展、结构化的机器翻译参数学习框架。

项目摘要

机器翻译是自然语言处理的难点问题之一。在利用机器学习方法解决机器翻译问题过程中,学习系统的参数学习过程面临多方面的重要挑战。项目组从参数建模、翻译评价、学习方法三个方面对机器翻译的参数学习过程展开研究并取得了进展。在参数建模方面,研究了基于结构信息、基于翻译过程、面向外部知识的建模技术;在翻译评价方面,研究了以多样性为核心翻译评价方法;在学习方法方面,研究了针对指数级样本空间的、面向翻译鲁棒性的、融入上下文和更多知识的学习方法。相关研究成果发表在自然语言处理和人工智能的顶级国际会议上,并在部分企业进行了合作研究和应用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020

陈家骏的其他基金

批准号:60673043
批准年份:2006
资助金额:24.00
项目类别:面上项目
批准号:61170181
批准年份:2011
资助金额:55.00
项目类别:面上项目

相似国自然基金

1

利用机器学习改进统计机器翻译的研究

批准号:60903138
批准年份:2009
负责人:刘洋
学科分类:F0211
资助金额:17.00
项目类别:青年科学基金项目
2

半参数统计中的若干问题

批准号:10301035
批准年份:2003
负责人:薛宏旗
学科分类:A0402
资助金额:7.00
项目类别:青年科学基金项目
3

统计关系学习中若干问题的研究

批准号:60573073
批准年份:2005
负责人:刘大有
学科分类:F06
资助金额:25.00
项目类别:面上项目
4

面向统计机器翻译的适应性学习与应用关键技术研究

批准号:61672367
批准年份:2016
负责人:姚建民
学科分类:F0211
资助金额:62.00
项目类别:面上项目