基于Web的大规模双语语料库挖掘及翻译知识自动获取

基本信息
批准号:60603095
项目类别:青年科学基金项目
资助金额:26.00
负责人:吕雅娟
学科分类:
依托单位:中国科学院计算技术研究所
批准年份:2006
结题年份:2009
起止时间:2007-01-01 - 2009-12-31
项目状态: 已结题
项目参与者:骆卫华,刘宏,刘洋,熊徳意,何中军,米海涛,付雷,黄利科,黃瑾
关键词:
翻译知识双语语料库Web双语网页
结项摘要

双语语料库在自然语言处理及机器翻译研究中的重要作用已经得到越来越多的认可。互联网中海量的文本信息所呈现的多语言、多领域性为大规模真实双语语料库的自动构建和翻译知识的自动获取提供了有利的条件。本申请充分利用Web丰富的结构和链接信息,探索自动,高效的双语语料库和翻译知识自动获取方案。具体研究内容包括基于Web的双语平行语料库和可比语料库的自动挖掘技术,双语网页相似度的计算模型,基于双语网页结构和内容信息的翻译句对抽取,特定领域的双语语料库获取以及特定领域术语翻译的自动获取技术。本研究的目标是建立一个基于web的,大规模、多粒度、多领域、多语言的翻译资源获取平台,实现持续的、动态的双语语料库资源的自动构建和翻译知识获取。本研究对于推动机器翻译及多语言信息处理研究的发展和实用化具有重要的理论意义和实际价值。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

A tale of two databases: the use of Web of Science and Scopus in academic papers

A tale of two databases: the use of Web of Science and Scopus in academic papers

DOI:10.1007/s11192-020-03387-8
发表时间:2020
2

口腔扁平苔藓研究热点前沿的可视化分析

口腔扁平苔藓研究热点前沿的可视化分析

DOI:10.7507/1672-2531.202012076
发表时间:2021
3

区块链技术:从数据智能到知识自动化

区块链技术:从数据智能到知识自动化

DOI:
发表时间:2017
4

A Fast Algorithm for Computing Dominance Classes

A Fast Algorithm for Computing Dominance Classes

DOI:
发表时间:2016
5

Toward Exposing Timing-Based Probing Attacks in Web Applications

Toward Exposing Timing-Based Probing Attacks in Web Applications

DOI:10.3390/s17030464
发表时间:2017

吕雅娟的其他基金

批准号:60873167
批准年份:2008
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

利用双语语料库获取翻译知识的研究

批准号:69672027
批准年份:1996
负责人:周明
学科分类:F0113
资助金额:10.00
项目类别:面上项目
2

基于多种双语平行语料相互关联分析的中轴语言统计翻译知识获取研究

批准号:61100093
批准年份:2011
负责人:朱聪慧
学科分类:F0211
资助金额:21.00
项目类别:青年科学基金项目
3

面向汉藏机器翻译的大规模双语语料库构建技术研究

批准号:61063033
批准年份:2010
负责人:才让加
学科分类:F0211
资助金额:33.00
项目类别:地区科学基金项目
4

纳西-汉语双语语料库构建与翻译方法研究

批准号:61163022
批准年份:2011
负责人:余正涛
学科分类:F0211
资助金额:49.00
项目类别:地区科学基金项目