As a basic tool in natural language processing, semantic lexicons such as WordNet and CCD have widely used in text analysis, machine translation, and other fields. However, along with Web 2.0, various of new words come forth every day. Hence the traditional expert-edited lexical databases cannot keep pace with the latest vocabulary in the real world. This project aims to integrate multiple different online encyclopedias and merge them to WordNet or WordNet-like semantic lexicons. This will not only help to improve the effect and efficiency of applications such as text analysis, but also remarkably help experts to polish the semantic lexicons. This project also plans to propose some learning approaches which can significantly improve the performance of text analysis and machine translation by exploiting the semantic relations in the lexicons.
WordNet、CCD等语义辞典作为自然语言处理的基础工具,被广泛地应用于文本分析、机器翻译等领域。然而,随着Web2.0的到来,各种新的词汇,特别是网络新词日新月异,使得传统的、专家编辑的语义辞典已经跟不上时代的步伐。本项目将研究如何对多个在线百科进行整合,从中提取出活跃的新词,添加到传统的语义辞典中,形成一个全新的、词汇覆盖率更大的语义辞典。这样一方面可提高用户使用语义辞典进行文本分析等应用时的使用效果,同时在专家对语义辞典进行丰富完善时,能够给予一定的帮助,提高精度和效率。除了提出一套通用方法和生成相应的增强版语义辞典外,本项目还考虑如何提炼语义辞典中词汇之间的语义关系,更好地应用于文本分析和机器翻译等任务中。
WordNet、CCD等语义辞典作为自然语言处理的基础工具,被广泛地应用于文本分析、阅读理解、机器翻译等领域。然而,随着Web2.0的到来,各种新的词汇,特别是网络新词日新月异,使得传统的、专家编辑的语义辞典已经跟不上时代的步伐。本项目按照研究计划,先后完成了多个在线百科的融合、利用在线百科对语义辞典扩展、语义辞典评价、具有领域偏向性的辞典生成、语义相似度计算、语义降维、语义辞典和知识库在信息检索中的应用、知识图谱在QA系统的应用等各项研究内容,实现了在关键技术研究层面以及系统应用层面的目标,并且探索了如何更好地把语义辞典和知识图谱应用到慕课课程开设和政府网站监测等实际系统中。目前正在研究具有领域偏向性的辞典(例如慕课课程辞典)如何更好地生成、应用和提高。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
现代优化理论与应用
高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析
铁路大跨度简支钢桁梁桥车-桥耦合振动研究
基于语义分析的汉语文本错误自动侦测与纠错方法
图像语义自动文本描述技术研究
面向自然语言文本生成的事件语义计算研究
文本自动分类中样本重要性模型及应用研究