基于生成树库分析与生成一体化机器翻译模型研究

基本信息

批准号：60973062

项目类别：面上项目

资助金额：28.00

负责人：荀恩东

学科分类：

依托单位：北京语言大学

批准年份：2009

结题年份：2012

起止时间：2010-01-01 - 2012-12-31

项目状态：已结题

项目参与者：牟小峰,蔡志超,黄志娥,吴礼文

关键词：

生成树库搜索算法译文调序统计机器翻译

结项摘要

面向英汉机器翻译的生成树库是北京语言大学研发的语料库，树库中的生成树中包含了机器翻译所需要的深层次、细粒度的翻译知识：英语的句法结构、汉语译文生成模式和词汇短语的习惯翻译等，本研究以该树库作为主要训练语料，结合现有的大规模双语和单语语料，研究建立面向英汉机器翻译分析和生成一体化统计模型：将规则化知识和统计方法有机结合在一起，避免规则方法层次化翻译过程所造成的错误累计，和规则不易把控的问题；同时，该模型统计对象为带有句法信息的英文短语和对应译文生成模式，解决了现有机器统计翻译以词或者短语为统计对象所造成的模型泛化能力差的问题。另外，现有的短语翻译模型短语限定为连续词串，译文生成时，全局调序能力差，生成树库具有大量短语调序知识，依托本树库，译文生成时短语预调序也是本研究另外主要内容。

项目摘要

课题采用生成树库，针对英汉翻译，通过专家规则与实例规则相结合的办法进行短语预调序。通过对英汉翻译中的短语结构进行分类，选择其中出现频度最高的名词短语进行预调序处理。实验结果显示，基于专家规则的预调序方法能够在一定程度上提高最终的翻译结果。.课题成果体现在：.1. 从英汉翻译的实际需求出发构造翻译所需要的语言资源。打破了Penn Treebank的复杂标注体系，将面向句法分析的句法标注改造为面向英汉机器翻译的句法标注，这有助于减少机器翻译过程中结构转换的复杂性。.2. 首次将短语预调序的方法应用在英汉机器翻译中，并将规则方法与统计方法结合起来，增强短语调序的效果。通过融合这两种不同的调序思路，提高了翻译结果。实验显示，融合的方法要优于单一的调序方法。.4. 基于大规模语料库的英汉短语预调序。实验结果显示，基于实例在保持较高调序准确率的情况下，克服了最大熵调序模型的缺陷。课题仍然有大量问题需要解决，主要包括：.1. 对短语结构转换的规则挖掘不彻底，停留在常用短语结构上，缺乏对短语结构转换更宏观的把握。.2. 与现有的短语翻译模型的融合不够，以致对翻译结果的提高幅度还可以增加。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16368/j.issn.1674-8999.2018.12.569

发表时间：2018

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

DOI：10.7524/j.issn.0254-6108.2021021801

发表时间：2022

DOI：10.16031/j.cnki.issn.1003-8035.2019.05.04

发表时间：2019

DOI：

发表时间：2017

荀恩东的其他基金

批准号：60573184

批准年份：2005

资助金额：5.00

项目类别：面上项目

批准号：61170162

批准年份：2011

资助金额：57.00

项目类别：面上项目

相似国自然基金

模型库的动态生成

批准号：68774044

批准年份：1987

负责人：赵仲宣

学科分类：F0304

资助金额：3.00

项目类别：面上项目

基于汉英双向树串模型的统计机器翻译研究

批准号：60872118

批准年份：2008

负责人：孙广范

学科分类：F0113

资助金额：29.00

项目类别：面上项目

基于格依存树到串模型的日汉机器翻译研究

批准号：61370130

批准年份：2013

负责人：徐金安

学科分类：F0211

资助金额：73.00

项目类别：面上项目

情景树生成与约简的实用有效算法

批准号：11571270

批准年份：2015

负责人：陈志平

学科分类：A0405

资助金额：50.00

项目类别：面上项目

基于生成树库分析与生成一体化机器翻译模型研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

肥胖型少弱精子症的发病机制及中医调体防治

"多对多"模式下GEO卫星在轨加注任务规划

水中溴代消毒副产物的生成综述

“阶跃式”滑坡突变预测与核心因子提取的平衡集成树模型

基于小波高阶统计量的数字图像来源取证方法

荀恩东的其他基金

非母语写作水平计算机自动评测技术研究

汉字书写规范性表征与评判

相似国自然基金