蒙古文是一种跨国、跨地区并且在国际上很有影响的语言文字。由于其具有十分复杂的语言特点,蒙古文也是最难信息化的语言文字之一。由于多方面的原因,现在蒙古文电子文档难于交流和共享。这严重制约了以蒙古文为载体的信息的产生、传播与查询。为此,我们提出了基于语言模型框架的跨汉蒙语言的信息检索的课题。课题以语言模型作为基础研究从汉语查询项检索蒙古语文档的信息技术。具体的研究内容有:(1)基于词缀信息的分层蒙古语语言模型;(2) 汉蒙跨语言的词向量翻译模型;(3) 基于机器翻译的查询结果Rerank,在此基础上,设计一个实验系统,实现跨汉语、蒙古语的检索平台,系统具有较高的查全率和查准率。该课题的研究必将对传承和发展少数民族文化、促进民族地区社会进步和稳定发展具有重要的意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
二维FM系统的同时故障检测与控制
信息熵-保真度联合度量函数的单幅图像去雾方法
扶贫资源输入对贫困地区分配公平的影响
基于内容的跨语言语音检索方法研究
面向汉语-泰语跨语言新闻事件检索方法研究
基于多语用户模型的个性化跨语言信息检索研究
基于双语文档反馈的跨语言信息检索研究