Automated question answering (QA) is an important branch of information retrieval area and a newly emerging hot research field. Nevertheless, current QA systems still have certain problems such as the difficulty of question analysis, the low accuracy of answer retrieval, etc. Particularly, a large number of accumulated questions/answers as a resource were partially wasted due to low reuse rate in user-interactive QA systems. Based on the investigation on improving answer accuracy utilizing semantic pattern, the project aims to improve question analysis and resource reuse from the point of view of intelligent information processing, targeting for the scientific problems in QA research area. The research topics include: Multi-dimensional semantic pattern modeling and its automated generation; Question categorization, similar/relevant question determination and retrieval; Answer retrieval from frequently asked questions using multi-dimensional semantic pattern; dynamic online incremental semantic pattern learning. In general, the project will conduct research on the multi-dimensional semantic pattern by integrating syntactic analysis, semantic analysis, knowledge representation, and dynamic learning methods, for providing a new solution to current QA research. The project is also expected to promote both theory and application development of the intelligence for QA systems.
问答系统是信息检索领域的一个重要分支和新兴的研究热点,但目前仍存在问题分析困难、答案抽取精度低等诸多问题,尤其是在用户交互问答系统中,大量积累的问答数据资源没有得到有效重用而产生了极大的浪费。本项目在深入调研利用语义模板提高答案精度的基础上,针对目前问答系统中存在的关键科学问题,从智能信息处理的角度出发,围绕问题分析和资源重用展开研究。主要研究内容包括:多维语义模板的模型定义和自动生成、基于多维语义模板的问题自动分类、相似问题和相关问题的判定和检索、常问问题答案抽取、模板的动态增量学习。研究将深入结合语法分析、语义分析、知识表示、动态学习等多种方法,构建适合问答系统的新型多维语义模板模型,提高问答数据的语义分析能力和答案抽取的精度,有效的重用数据资源,为问答系统研究提供新的解决方法,这对推动问答系统的智能化研究与发展具有重要的理论意义和应用价值。
问答系统是信息检索领域的一个重要分支和新兴的研究热点,但目前仍存在问题分析困难、答案抽取精度低等诸多问题,尤其是在用户交互问答系统中,大量积累的问答数据资源没有得到有效重用而产生了极大的浪费。基于此,本项目重点开展了:面向问答系统的问题目标识别与分类研究、语义模板模型和问答数据重用方法研究、面向问答系统的问题表示模型研究、问答系统中相似问题的自动识别方法研究、面向大规模文本数据的信息抽取研究、问答数据中用户兴趣主题的自动发现方法研究。通过本项目的实施,产出了丰富的科研成果。在学术创新研究方面,提出了一种新的结合语义和模板的问题表示模型,通过问题目标的识别和分析、自动语义标注、模板匹配等实现问答数据的匹配,有利于提高问题表示和处理的效率和性能;提出了一种基于语义扩展的问题目标识别和分类方法,该方法与现有方法的对比中取得了最好实验效果,研究有利于促进精准问题目标识别;提出了一种从异构文本数据中挖掘语义标签的方法,该方法有利于提高问答系统在问题分析、答案抽取上的语义分析能力;提出了一种新的辅助问答数据重用的问题表示模型,模型通过定义三种问题词型和一种语义模板来分析问题,其中包括问题目标的分类信息,通过与现有常用方法的对比取得了最好的精度,验证了方法的有效性,对大规模问答数据重用具有理论和应用价值。本项目共计发表英文学术论文18篇(第一或通讯作者),其中SCI索引5篇、EI索引13篇;构建了多个原型系统并经过了初步验证;通过项目组成员的分工与合作,培养了1名博士生、3名硕士生、10多名本科生参与课题研究,锻炼了学生的科研能力和系统开发能力。
{{i.achievement_title}}
数据更新时间:2023-05-31
EBPR工艺运行效果的主要影响因素及研究现状
复杂系统科学研究进展
二维FM系统的同时故障检测与控制
现代优化理论与应用
末次盛冰期以来中国湖泊记录对环流系统及气候类型的响应
基于粒计算与语义模板的问答系统研究
面向Wiki的多维动态语义计算模型及关键技术研究
基于大数据深度语义表示学习的农业智能问答研究
面向高可靠的开放域问答研究