The primary task of cross Chinese and Slavic Mongolian information retrieval is to research the techniques of searching relative documents from Slavic Mongolian documents, with Chinese query terms. This project is very important to the security of our country and keeking stablization. The main technique route is: Constructing keywords table using text opportunity finding, and constructing the index of documents; Translating query terms from Chinese to Slavic Mongolian using machine translation; Searching the relative documents, generating basic document set; Getting some primary segements and translating into Chinese; Reranking the results using Chinese query terms. The contents of this project is: Keyword extracting method based on opportunity text finding, tranlating segment extracting method base on pesudo-feedback model, searching model of Slavic Mongolian information retrieval, and reranking based on machine translation.
跨汉斯拉夫蒙古文的信息检索关键技术研究的主要任务是研究以汉语关键词查询大量斯拉夫蒙古文文档中相关文档的关键技术。本课题的研究对于保障国家信息安全和维护稳定具有重要的意义。主要技术路线为:首先利用基于文本机会发现的方法构建斯拉夫蒙古文关键词集,利用这个集合构建待检索文档集索引;通过机器翻译技术将汉文查询项翻译为斯拉法蒙古文查询项;利用斯拉夫蒙古文查询项检索文档集,形成初始查询结果集;提取结果集中的翻译片段,翻译为汉文;用汉文查询项和翻译结果进行冲排序。本课题的主要研究内容是:基于文本机会发现的关键词自动抽取技术、基于伪相关反馈模型的翻译片段提取技术、斯拉夫蒙古文检索模型和基于机器翻译技术的检索结果Rerank技术。
跨汉斯拉夫蒙古文的信息检索关键技术研究的主要任务是研究以汉语关键词查询大量斯拉夫蒙古文文档中相关文档的关键技术。本课题的研究对于保障国家信息安全和维护稳定具有重要的意义。主要技术路线为:首先利用基于文本机会发现的方法构建斯拉夫蒙古文关键词集,利用这个集合构建待检索文档集索引;通过机器翻译技术将汉文查询项翻译为斯拉法蒙古文查询项;利用斯拉夫蒙古文查询项检索文档集,形成初始查询结果集;提取结果集中的翻译片段,翻译为汉文;用汉文查询项和翻译结果进行冲排序。本课题的主要研究内容是:基于文本机会发现的关键词自动抽取技术、基于伪相关反馈模型的翻译片段提取技术、斯拉夫蒙古文检索模型和基于机器翻译技术的检索结果Rerank技术。项目研究成果有:1)提出了针对蒙古文自身语言特点以及稀少资源语言机器翻译任务难点的优化算法,构建了斯拉夫蒙古文到汉文,以及汉文到斯拉夫蒙古文机器翻译系统。此外,为了充分利用各个翻译模型的优点,获得更好的蒙汉机器翻译译文,提出了基于神经网络的双语句子相似度重排序算法,将多翻译系统进行融合,提升机器翻译整体翻译水平。2)提出了基于Helmholtz原理的中文的新词识别方法。3)基于图模型的短文本关键词抽取方法。在本项目的研究中重点研究了在蒙汉信息检索中的机器翻译方法,有效提高了信息检索的效果,对未来跨汉蒙语言的信息检索研究和机器翻译研究具有重要意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于关系对齐的汉语虚词抽象语义表示与分析
星形四面体型索穹顶构形和预应力分析方法
语言特征视域下梵汉藏《因明入正理论》对勘研究
面向数据的英汉双向跨语言信息检索关键技术研究
维吾尔、哈萨克、柯尔克孜文跨语言信息检索技术研究
多方法融合的蒙古文古籍图像检索技术研究
面向英汉双向跨语言信息检索的若干自然语言处理底层关键技术研究