Recent years have witnessed the rapid development of neural machine translation (NMT), which has become the new mainstream technique in the area of machine translation. However, in the absence of explicit linguistic knowledge (e.g., syntax and semantics), the popular NMT model tends to produce improper translations, like unfaithful translation, under-translation, and over-translation. This proposal aims to explore modeling sentence-level structures and semantics for NMT from two perspectives: modeling sentence-level syntax, word/phrase semantics, and sentence-level shallow semantics for NMT to generate faithful translations, and modeling structures and relations among clauses for better translating long sentences. The main research content of the proposal includes: 1) modeling syntax for NMT; 2) modeling word/phrase semantics for NMT; 3) modeling sentence shallow semantics for NMT; and 4) modeling clause-level rhetorical structures and relations for NMT.
近年来,基于深度学习的神经机器翻译方法获得迅速发展,已成为目前的主流方法。不过,主流NMT模型在翻译过程中缺乏对句子的结构和语义信息的有效利用,经常会出现译文跑偏现象,包括错翻、漏翻和过翻等。本项目在前面研究的基础上,分别从句子内部和子句间,系统深入探索融合句子级结构与语义的神经机器翻译方法:一方面从句子内部句法结构、词/短语/句子语义信息控制句子译文的跑偏;二是如何从子句间的结构和语义角度控制长句译文的跑偏。主要研究内容包括:1) 研究融合句法结构的神经机器翻译方法;2) 研究融合词/短语语义的神经机器翻译方法;3) 研究融合句子浅层语义的神经机器翻译方法;和4) 研究融合子句间修辞结构和语义关系的神经机器翻译方法。
近年来,基于深度学习的神经机器翻译方法获得迅速发展,已成为目前的主流方法。不过,主流NMT模型在翻译过程中缺乏对句子的结构和语义信息的有效利用,经常会出现译文跑偏现象,包括错翻、漏翻和过翻等。本项目在前面研究的基础上,分别从句子内部和子句间,系统深入探索融合句子级结构与语义的神经机器翻译方法:一方面从句子内部句法结构、词/短语/句子语义信息控制句子译文的跑偏;二是如何从子句间的结构和语义角度控制长句译文的跑偏。主要研究内容包括:1) 研究融合句法结构的神经机器翻译方法;2) 研究融合词/短语语义的神经机器翻译方法;3) 研究融合句子浅层语义的神经机器翻译方法;和4) 研究融合子句间修辞结构和语义关系的神经机器翻译方法。四年来项目按计划推进,顺利完成了各项工作,主要成果有:1) 提出了融合词法和句法的句子对齐和机器翻译模型;2) 提出了融合句子语义的一系列神经机器翻译模型;3) 提出了融合文档内句间结构的一系列文档级神经机器翻译模型;4) 提出了一系列句子语义(AMR)分析模型。上述成果的取得,为今后的神经机器翻译研究提供了基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
病毒性脑炎患儿脑电图、神经功能、免疫功能及相关因子水平检测与意义
妊娠对雌性大鼠冷防御性肩胛间区棕色脂肪组织产热的影响及其机制
基于被动变阻尼装置高层结构风振控制效果对比分析
神经退行性疾病发病机制的研究进展
基于改进LinkNet的寒旱区遥感图像河流识别方法
基于句子语义结构的统计机器翻译研究
句子阅读中语义整合的神经机制
句子语义的视觉表示研究
汉语句子理解中语义和句法整合的认知神经机制