双语语料库在自然语言处理及机器翻译研究中的重要作用已经得到越来越多的认可。互联网中海量的文本信息所呈现的多语言、多领域性为大规模真实双语语料库的自动构建和翻译知识的自动获取提供了有利的条件。本申请充分利用Web丰富的结构和链接信息,探索自动,高效的双语语料库和翻译知识自动获取方案。具体研究内容包括基于Web的双语平行语料库和可比语料库的自动挖掘技术,双语网页相似度的计算模型,基于双语网页结构和内容信息的翻译句对抽取,特定领域的双语语料库获取以及特定领域术语翻译的自动获取技术。本研究的目标是建立一个基于web的,大规模、多粒度、多领域、多语言的翻译资源获取平台,实现持续的、动态的双语语料库资源的自动构建和翻译知识获取。本研究对于推动机器翻译及多语言信息处理研究的发展和实用化具有重要的理论意义和实际价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
A tale of two databases: the use of Web of Science and Scopus in academic papers
口腔扁平苔藓研究热点前沿的可视化分析
区块链技术:从数据智能到知识自动化
A Fast Algorithm for Computing Dominance Classes
Toward Exposing Timing-Based Probing Attacks in Web Applications
利用双语语料库获取翻译知识的研究
基于多种双语平行语料相互关联分析的中轴语言统计翻译知识获取研究
面向汉藏机器翻译的大规模双语语料库构建技术研究
纳西-汉语双语语料库构建与翻译方法研究