As a basic tool in natural language processing, semantic lexicons such as WordNet and CCD have widely used in text analysis, machine translation, and other fields. However, along with Web 2.0, various of new words come forth every day. Hence the traditional expert-edited lexical databases cannot keep pace with the latest vocabulary in the real world. This project aims to integrate multiple different online encyclopedias and merge them to WordNet or WordNet-like semantic lexicons. This will not only help to improve the effect and efficiency of applications such as text analysis, but also remarkably help experts to polish the semantic lexicons. This project also plans to propose some learning approaches which can significantly improve the performance of text analysis and machine translation by exploiting the semantic relations in the lexicons.
WordNet、CCD等语义辞典作为自然语言处理的基础工具,被广泛地应用于文本分析、机器翻译等领域。然而,随着Web2.0的到来,各种新的词汇,特别是网络新词日新月异,使得传统的、专家编辑的语义辞典已经跟不上时代的步伐。本项目将研究如何对多个在线百科进行整合,从中提取出活跃的新词,添加到传统的语义辞典中,形成一个全新的、词汇覆盖率更大的语义辞典。这样一方面可提高用户使用语义辞典进行文本分析等应用时的使用效果,同时在专家对语义辞典进行丰富完善时,能够给予一定的帮助,提高精度和效率。除了提出一套通用方法和生成相应的增强版语义辞典外,本项目还考虑如何提炼语义辞典中词汇之间的语义关系,更好地应用于文本分析和机器翻译等任务中。
WordNet、CCD等语义辞典作为自然语言处理的基础工具,被广泛地应用于文本分析、阅读理解、机器翻译等领域。然而,随着Web2.0的到来,各种新的词汇,特别是网络新词日新月异,使得传统的、专家编辑的语义辞典已经跟不上时代的步伐。本项目按照研究计划,先后完成了多个在线百科的融合、利用在线百科对语义辞典扩展、语义辞典评价、具有领域偏向性的辞典生成、语义相似度计算、语义降维、语义辞典和知识库在信息检索中的应用、知识图谱在QA系统的应用等各项研究内容,实现了在关键技术研究层面以及系统应用层面的目标,并且探索了如何更好地把语义辞典和知识图谱应用到慕课课程开设和政府网站监测等实际系统中。目前正在研究具有领域偏向性的辞典(例如慕课课程辞典)如何更好地生成、应用和提高。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于语义分析的汉语文本错误自动侦测与纠错方法
图像语义自动文本描述技术研究
面向自然语言文本生成的事件语义计算研究
文本自动分类中样本重要性模型及应用研究