This project is to construct the Mongolian lexical network which uses the automatic conversion and artificial intervention method as the main research method,a basic research project which can be applied to query Mongolian lexical semantic information and the research of the Mongolian machine translation system .The project uses the "Mongolian Grammatical Information Dictionary"as the basic resourses,researching the construction method of the mongolian lexical synonym set and the expression method of the lexical semantic relaiton.The research combines the rational WordNet frame with the originality of the mongolian lexical semantic system,it firstly uses the method "The mongolian lexical is mapped to the WordNet lexical conception" to automaticly generate the basic frame of the Mongolian lexical network and then uses the mongolian lexical synonym set to modify the lexical relationship to generate the semantic network which adjusts to the character of the Mongolian language.The construction of the Mongolian lexical network will achieve the goal to make the common customers find out the synonym information and the hyponym information and at the same time meet the professional users'lexical concept retrieval processing needs to large-scale corpus.Mongolian lexical semantic network provides comprehensive semantic knowledge for automatic processing of lexical concepts of the machine translation, automatic proofreading, text retrieval system. And it has a wide application prospect in the field of Language teaching, bilingual comparison research and other fields.
本项目是一个自动转换与人工干预相结合的方法构造蒙古语词汇语义网,以能够应用于蒙古语词汇语义查询及机器翻译等应用系统为目标的基础研究项目。项目以已有成果"蒙古语语义信息词典"为基础数据,全面系统地研究蒙古语词汇的同义词集合构造方法、词汇语义关系表示方法。本研究兼顾WordNet框架的合理性和蒙古语词汇语义系统的独特性,首先通过从蒙古语词汇映射到WordNet词汇概念的的方式自动生成蒙古语词汇语义网的基本框架,再利用蒙古语各类语义知识库进行语义关系的"修剪"后逐步生成符合蒙古语本身特点的词汇语义网。蒙古语词汇语义网的构建,可以满足普通用户的的同义词、上下位词等词汇语义信息查找,同时可以满足专业用户对大规模语料中词汇概念检索处理需求。蒙古语词汇语义网为机器翻译、自动校对、文本检索等应用系统中词汇概念的自动处理提供全面的语义知识,在语言教学、双语对比研究等领域都有着广泛的应用前景。
本项目是一个自动转换与人工干预相结合的方法构造蒙古语词汇语义网,以能够应用于蒙古语词汇语义查询及机器翻译等应用系统为目标的基础研究项目。项目主要研究内容是以现有成果“蒙古语语义信息词典”为基础数据,全面系统地研究蒙古语词汇的同义词集合构造方法、词汇语义关系表示方法,研究与WordNet兼容的蒙古语词汇语义网的构建方法、 研究实现词汇语义网的管理维护方法。通过本项目的实施最终得出了如下成果: (1)建立了22533个词汇规模的蒙古语词汇语义网的数据库。目前为止总共纳入22533条词汇、其中包括名词14185条、动词2343条、形容词6005条。在上述词汇的基础上构建了15211个同义词集合,其中包括名词同义词集合9401、动词同义词集合1823、形容词同义词集合3987个。有些词汇概念是蒙古语独有词汇概念,如 (干酪)是WordNet词汇库中不存在对应概念,需要蒙古语词汇语义网中新建一个节点,并为它建立各种语义关系。本项研究中涉及到104条类似词汇概念节点。(2)设计实现了蒙古文词汇语义信息查询与管理维护功能。所建立的语义网查询维护系统包括针对普通用户的词汇语义查询功能及针对管理员用户的语义网数据库管理维护功能。(3) 探索了基于词汇语义网的词汇歧义消除算法,从而对机器翻译等应用领域提供较好的辅助性知识库。词汇概念之间语义关系的简明结构使得词汇语义网成为词义消歧的主要知识资源。(4)课题组发表了6篇学术论文、5篇学位论文、出版了1部专著、申请登记了1项软件著作权。蒙古语词汇语义网的构建,可以满足普通用户的的同义词、上下位词等词汇语义信息查找,同时可以满足专业用户对大规模语料中词汇概念检索处理需求。蒙古语词汇语义网为机器翻译、自动校对、文本检索等应用系统中词汇概念的自动处理提供全面的语义知识,在语言教学、双语对比研究等领域都有着广泛的应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
内质网应激在抗肿瘤治疗中的作用及研究进展
基于关系对齐的汉语虚词抽象语义表示与分析
基于语义分析的评价对象-情感词对抽取
融合语义信息的汉老双语句子对其方法
语境调节词汇语义和后词汇语义加工的大脑动态机制
基于词汇语义网络的中文深层语义分析
汉语亚词汇语义加工的发展研究
《蒙古语语义信息词典》的设计与实现