组排序学习方法的研究与应用

基本信息
批准号:61402075
项目类别:青年科学基金项目
资助金额:24.00
负责人:林原
学科分类:
依托单位:大连理工大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:许侃,刘文飞,孙晓玲,杨亮,徐博,郭青
关键词:
信息检索排序学习查询扩展机器学习
结项摘要

Information retrieval is important to acquire knowledge and understand the world in the internet age today, and an essential issue in information retrieval is ranking. The group based ranking framework provides a new direction for learning to rank by the construction of loss function based on group sample, which can also improve the ranking performance of information retrieval. Current group ranking method is in theory research phase to be perfect. Faced with this situation, this project is based on group sample to research the theory and application of learning to rank. To theory research based on loss function of learning to rank, the group based ranking framework is improved by the research of loss function integration and directly optimizing information retrieval evaluation measures. To application the group based learning to rank approach is applied to the research fields such as query expansion and movie ranking. This project is effective to improve the research level of learning to rank, and provide new idea and theory for application of learning to rank.

信息检索是当今互联网时代获取知识、了解世界的重要手段,排序则是其研究的核心问题。针对排序进行优化的排序学习方法对于信息检索的研究以及互联网的发展都有着重要的意义。组排序学习方法通过组样本的损失函数构造为排序学习方法的研究提供的新的方向,能够有效的提高信息检索任务的准确率。当前组排序学习方法的研究正处于理论研究,亟待完善的阶段。针对这种情况,本项目从理论和应用两个方面展开研究。理论研究方面重点从排序学习方法损失函数构造入手改进已有的组样本排序学习方法,通过对多损失函数融合模型、直接优化评价方法的研究来完善组排序学习方法。应用研究方面主要将组排序学习方法的应用于查询扩展、电影排名预测等问题的研究。本项目的研究有助于提高排序学习方法的研究水平,为排序学习方法的应用提供新的思路与理论依据。

项目摘要

信息检索是当今互联网时代获取知识、了解世界的重要手段,排序则是其研究的核心问题。针对排序进行优化的排序学习方法对于信息检索的研究以及互联网的发展都有着重要的意义。组排序学习方法通过组样本的损失函数构造为排序学习方法的研究提供的新的方向,能够有效的提高信息检索任务的准确率。本项目从组排序学习理论和应用两个方面展开研究。. 理论研究方面,首先是基于神经网络方法的组排序学习方法的研究,采用相关性偏序关系交叉熵损失函数和似然损失函数的构造的最优序列的选择等方法对于组样本损失函数的性能进行改进;其次是直接优化信息检索评价方法的研究,提出一种基于位置优化的方法来代替已有的基于信息检索优化的方法。最后是多样本损失函数融合的研究,提出了一个损失函数融合框架,并且基于组排序方法损失函数,融合Pointwise、Pairwise和Listwise样本的损失函数,使用加权方案来结合不同类型的损失函数以提高排序性能。. 应用研究方面,首先是排序学习学方法在查询扩展中的应用分为三个研究内容。伪相关反馈词排序模型的研究;基于社会化标注的查询扩展方法;基于不同信息资源的专利查询扩展词选择方法,提高了查询扩展方法的性能。其次是排序学习方法在电影排名推荐的应用研究,基于BOX Office威电影媒体网站提取排名特征采用排序学习方法训练排名模型用于电影推荐任务。最后是生物医学文献检索的应用研究,基于组排序学习方法进行文档标注,该方法的初衷在于通过将同一查询下具有不同多样性的文档分组,实现面向多样性的文档排序模型的构建。. 基于项目的研究工作,发表及录用学术论文19篇,其中SCI刊源论文7篇,SCI检索论文5篇,EI检索论文6篇,CSSCI检索论文1篇,北大中文核心期刊论文2篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
2

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
3

信息熵-保真度联合度量函数的单幅图像去雾方法

信息熵-保真度联合度量函数的单幅图像去雾方法

DOI:10.3724/SP.J.1089.2019.17435
发表时间:2019
4

现代优化理论与应用

现代优化理论与应用

DOI:10.1360/SSM-2020-0035
发表时间:2020
5

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

DOI:10.7498/aps.68.20181682
发表时间:2019

林原的其他基金

批准号:11872325
批准年份:2018
资助金额:54.00
项目类别:面上项目
批准号:20373075
批准年份:2003
资助金额:24.00
项目类别:面上项目
批准号:20973183
批准年份:2009
资助金额:35.00
项目类别:面上项目
批准号:11572273
批准年份:2015
资助金额:60.00
项目类别:面上项目
批准号:81102021
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:30772601
批准年份:2007
资助金额:27.00
项目类别:面上项目
批准号:39670166
批准年份:1996
资助金额:8.50
项目类别:面上项目
批准号:29403026
批准年份:1994
资助金额:8.00
项目类别:青年科学基金项目
批准号:30070203
批准年份:2000
资助金额:16.00
项目类别:面上项目
批准号:51673204
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:31901586
批准年份:2019
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

大数据可信排序学习方法及其并行化研究

批准号:61762052
批准年份:2017
负责人:李金忠
学科分类:F0211
资助金额:37.00
项目类别:地区科学基金项目
2

时空深度学习方法与应用

批准号:61772299
批准年份:2017
负责人:龙明盛
学科分类:F0605
资助金额:66.00
项目类别:面上项目
3

几个排序问题的研究及应用

批准号:10771060
批准年份:2007
负责人:李荣珩
学科分类:A0406
资助金额:25.00
项目类别:面上项目
4

排序主题模型及其应用研究

批准号:61272369
批准年份:2012
负责人:鲁明羽
学科分类:F0607
资助金额:80.00
项目类别:面上项目