Pseudo Relevance Feedback (PRF) is an effective technique for solving the term mismatching problem in Information Retrieval(IR). In traditional PRF models, the top K documents from the first-pass retrieval are assumed to be relevant. This assumption may cause: 1) when the quality of the feedback document set is low, noise will be brought in the reformulated query; 2) documents with different quality level are treated in the same way while they have different impact to PRF model in reality. In this research, we propose to use machine learning and web mining techniques to address the above problems. In particular, 1) we present a new assumption for PRF, and propose a quality-biased PRF retrieval framework; 2) we present a new topic-based assumption, and proposed a topic-based PRF model and query-related topic extraction models; 3) propose an external resource based PRF model to address the problem of low quality of feedback documents.
伪相关反馈是解决信息检索过程中词不匹配问题的有效手段,是提高信息检索准确率和召回率的关键技术之一。在传统基于查询扩展的伪相关反馈技术中,由于假设初次检索得到前K篇文档为相关文档,使得1)当初次检索返回文档集质量不高时,容易引入噪音;2)不同质量反馈文档无法区分对待。本课题重新审视伪相关反馈的基础假设,研究如何挖掘网络资源和使用机器学习技术来解决伪相关反馈中若干关键问题,进一步提高基于查询扩展的相关反馈技术的性能:1)引入新的基于质量偏重相关反馈假设,并提出面向相关反馈文档质量评估模型;2)引入新的基于主题相关反馈假设,并提出查询相关反馈主题提取算法;3)提出基于多种外部资源的反馈模型,解决首次查询精度较差时,反馈文档质量无法得到保证的问题。
伪相关反馈是解决信息检索过程中词不匹配问题的有效手段,是提高信息检索准确率和召回率的关键技术之一。在传统基于查询扩展的伪相关反馈技术中,由于假设初次检索得到前K篇文档为相关文档,使得1)当初次检索返回文档集质量不高时,容易引入噪音;2)不同质量反馈文档无法区分对待。本课题主要研究如何挖掘网络资源和使用机器学习技术进一步提高基于查询扩展的相关反馈技术的性能:1)引入新的基于质量偏重相关反馈假设,并提出面向相关反馈文档质量评估模型;2)引入新的基于主题相关反馈假设,并提出查询相关反馈主题提取算法;3)提出基于多种外部资源的反馈模型,解决首次查询精度较差时,反馈文档质量无法得到保证的问题。
{{i.achievement_title}}
数据更新时间:2023-05-31
新型树启发式搜索算法的机器人路径规划
现代优化理论与应用
基于自适应干扰估测器的协作机器人关节速度波动抑制方法
相关系数SVD增强随机共振的单向阀故障诊断
山西省大气PM2.5 污染时空分布特征∗
结构化机器学习若干关键问题研究
基于局部特征的多视角学习算法若干关键问题的研究
多核学习若干关键问题研究
机器学习中的若干重要问题研究