The learning process of statistical machine translation includes defining the representation of parameters and perform parameter estimation according to a certain translation quality evaluation metric, with a certain machine learning method. We interpret this whole process as a process of parameter learning. The parameter learning process has a direct impact to the machine translation quality. As a result, the research on the parameter learning process plays a crucial part in the research of statistical machine translation. On the other hand, machine translation is a special instance of the structured prediction tasks. The research progress on the parameter learning for machine translation will also promote related research in machine learning and data mining areas. This proposal plans to conduct research from three perspectives of the parameter learning, namely parameter modeling, translation evaluation and learning method. The aim of the project is to study a extendible and structured parameter learning framework for machine translation, which includes extendible and nonlinear parameter modeling methods, translation quality evaluation metrics and parameter estimation strategies suitable for this special structured prediction task.
统计机器翻译的学习过程实际是遵照机器翻译问题的特点和规律对参数进行定义,并根据一定的翻译质量评价标准,采用一定的机器学习方法从训练数据中对参数进行估计的过程。本项目从参数学习的角度看待这个过程,将整个过程称为参数学习过程。参数学习过程对提高机器翻译的翻译质量有着直接而重要的影响,是探索高质量机器翻译的必须解决的重要问题。同时,因为机器翻译是一类特殊的结构化学习问题,这类问题的参数学习研究也为机器学习和数据挖掘领域的研究提出了新的挑战。本项目的研究试图从参数建模、翻译评价、学习方法三个方面重新思考统计机器翻译问题,研究可扩展的非线性参数建模方法,适合参数学习的翻译评价标准以及与之相适应的结构化学习策略,从而形成一套可扩展、结构化的机器翻译参数学习框架。
机器翻译是自然语言处理的难点问题之一。在利用机器学习方法解决机器翻译问题过程中,学习系统的参数学习过程面临多方面的重要挑战。项目组从参数建模、翻译评价、学习方法三个方面对机器翻译的参数学习过程展开研究并取得了进展。在参数建模方面,研究了基于结构信息、基于翻译过程、面向外部知识的建模技术;在翻译评价方面,研究了以多样性为核心翻译评价方法;在学习方法方面,研究了针对指数级样本空间的、面向翻译鲁棒性的、融入上下文和更多知识的学习方法。相关研究成果发表在自然语言处理和人工智能的顶级国际会议上,并在部分企业进行了合作研究和应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
气载放射性碘采样测量方法研究进展
利用机器学习改进统计机器翻译的研究
半参数统计中的若干问题
统计关系学习中若干问题的研究
面向统计机器翻译的适应性学习与应用关键技术研究