基于深度句法的统计机器翻译方法研究

基本信息
批准号:61672138
项目类别:面上项目
资助金额:16.00
负责人:肖桐
学科分类:
依托单位:东北大学
批准年份:2016
结题年份:2017
起止时间:2017-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:张春良,战学刚,迟呈英,张美娜,杜权,王强,李洋,杨木润,胡博杰
关键词:
翻译优化统计机器翻译解码算法句法分析训练算法
结项摘要

Statistical machine translation (SMT) has been intensively studied for years. Many models have been developed, ranging from word-based models to phrase-based models and conventional syntax-based models. In spite of the great interests by the SMT community, it is more difficult to improve conventional syntax-based systems. A fundamental issue that arises is: how to introduce deep syntax into SMT and develop multi-level syntax-based approaches for next generation of machine translation...In this proposal, we propose to address this issue in two aspects: 1) we investigate methods to represent deep syntax for machine translation; 2) we investigate deep syntax-based methods for machine translation. In particular, we explore derivation-based SMT approaches. All research outcomes will be integrated into the NiuTrans SMT platform and will be released for public.

统计机器翻译已经从基于词的模型发展到基于短语和基于传统句法的模型。虽然基于传统句法表示的机器翻译已经受到很多研究者的关注,但是直接沿用单语句法分析中的句法表示形式,并进行相应的建模已经进入了平台期。如何在机器翻译中使用深度句法信息并构建基于多层次句法的机器翻译框架已经成为了当前机器翻译中的主要问题之一。本项目拟围绕此问题展开研究工作,主要研究内容包括:1)研究面向机器翻译的深度句法表示形式;2)研究翻译推导模型,并探索基于多层次句法的统计机器翻译框架。最终,本项目的研究成果会被集成到NiuTrans开源平台中,为学术界共享使用。

项目摘要

统计机器翻译已经从基于词的模型发展到基于短语和基于传统句法的模型。虽然基于传统句法表示的机器翻译已经受到很多研究者的关注,但是直接沿用单语句法分析中的句法表示形式,并进行相应的建模已经进入了平台期。如何在深度神经网络进行机器翻译并且在这个过程中融入句法信息是当今自然语言处理领域的主要问题之一。本项目拟围绕此问题展开研究工作,主要研究内容包括:1)研究面向深度神经语言模型和翻译模型的并行训练方法;2)研究源语言句法信息在神经机器翻译的集成方法;3)研究基于句法的可实用化机器翻译方法。本项目的研究成果包括4篇高水平论文(其中2篇领域顶级会议及期刊论文IJCAI和EMNLP),培养了5名研究生。研究成果最终集成在NiuTrans系统中。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
2

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
3

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
4

"多对多"模式下GEO卫星在轨加注任务规划

"多对多"模式下GEO卫星在轨加注任务规划

DOI:10.19328/j.cnki.2096-8655.2022.02.002
发表时间:2022
5

药食兼用真菌蛹虫草的液体发酵培养条件优化

药食兼用真菌蛹虫草的液体发酵培养条件优化

DOI:
发表时间:2021

肖桐的其他基金

批准号:41501117
批准年份:2015
资助金额:24.00
项目类别:青年科学基金项目
批准号:61300097
批准年份:2013
资助金额:28.00
项目类别:青年科学基金项目
批准号:61876035
批准年份:2018
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

基于主干成分的句法统计机器翻译模型研究

批准号:61300097
批准年份:2013
负责人:肖桐
学科分类:F0211
资助金额:28.00
项目类别:青年科学基金项目
2

基于句法结构和篇章结构的统计机器翻译关键技术研究

批准号:61373095
批准年份:2013
负责人:张民
学科分类:F0211
资助金额:79.00
项目类别:面上项目
3

基于句法结构和语义框架的机器翻译自动评价方法研究

批准号:61379086
批准年份:2013
负责人:刘群
学科分类:F0211
资助金额:73.00
项目类别:面上项目
4

基于图的统计机器翻译方法研究

批准号:61003111
批准年份:2010
负责人:巢文涵
学科分类:F0211
资助金额:7.00
项目类别:青年科学基金项目