基于Web的大规模双语语料库挖掘及翻译知识自动获取

基本信息

批准号：60603095

项目类别：青年科学基金项目

资助金额：26.00

负责人：吕雅娟

学科分类：

依托单位：中国科学院计算技术研究所

批准年份：2006

结题年份：2009

起止时间：2007-01-01 - 2009-12-31

项目状态：已结题

项目参与者：骆卫华,刘宏,刘洋,熊徳意,何中军,米海涛,付雷,黄利科,黃瑾

关键词：

翻译知识双语语料库Web双语网页

结项摘要

双语语料库在自然语言处理及机器翻译研究中的重要作用已经得到越来越多的认可。互联网中海量的文本信息所呈现的多语言、多领域性为大规模真实双语语料库的自动构建和翻译知识的自动获取提供了有利的条件。本申请充分利用Web丰富的结构和链接信息，探索自动，高效的双语语料库和翻译知识自动获取方案。具体研究内容包括基于Web的双语平行语料库和可比语料库的自动挖掘技术，双语网页相似度的计算模型，基于双语网页结构和内容信息的翻译句对抽取，特定领域的双语语料库获取以及特定领域术语翻译的自动获取技术。本研究的目标是建立一个基于web的，大规模、多粒度、多领域、多语言的翻译资源获取平台，实现持续的、动态的双语语料库资源的自动构建和翻译知识获取。本研究对于推动机器翻译及多语言信息处理研究的发展和实用化具有重要的理论意义和实际价值。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1007/s11192-020-03387-8

发表时间：2020

DOI：10.7507/1672-2531.202012076

发表时间：2021

DOI：

发表时间：2017

DOI：

发表时间：2016

DOI：10.3390/s17030464

发表时间：2017

吕雅娟的其他基金

批准号：60873167

批准年份：2008

资助金额：30.00

项目类别：面上项目

相似国自然基金

利用双语语料库获取翻译知识的研究

批准号：69672027

批准年份：1996

负责人：周明

学科分类：F0113

资助金额：10.00

项目类别：面上项目

基于多种双语平行语料相互关联分析的中轴语言统计翻译知识获取研究

批准号：61100093

批准年份：2011

负责人：朱聪慧

学科分类：F0211

资助金额：21.00

项目类别：青年科学基金项目

面向汉藏机器翻译的大规模双语语料库构建技术研究

批准号：61063033

批准年份：2010

负责人：才让加

学科分类：F0211

资助金额：33.00

项目类别：地区科学基金项目

纳西-汉语双语语料库构建与翻译方法研究

批准号：61163022

批准年份：2011

负责人：余正涛

学科分类：F0211

资助金额：49.00

项目类别：地区科学基金项目

基于Web的大规模双语语料库挖掘及翻译知识自动获取

{{i.achievement_title}}

暂无此项成果

其他相关文献

A tale of two databases: the use of Web of Science and Scopus in academic papers

口腔扁平苔藓研究热点前沿的可视化分析

区块链技术:从数据智能到知识自动化

A Fast Algorithm for Computing Dominance Classes

Toward Exposing Timing-Based Probing Attacks in Web Applications

吕雅娟的其他基金

面向科技文献的机器翻译关键技术研究

相似国自然基金