面向大规模数据的多示例学习

基本信息
批准号:61403281
项目类别:青年科学基金项目
资助金额:25.00
负责人:王志岗
学科分类:
依托单位:天津理工大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:龚平华,周冕,王耽,张颖,刘少强,宋健明
关键词:
多示例学习在线多示例学习多示例核函数
结项摘要

Multiple instance learning (MIL) has become a hot research topic in the fields of machine learning and data mining in recent years. The training of existing MIL methods on large scale data usually requires too high time and space costs, which is unacceptable in most cases. This project studies the efficient and effective MIL methods on large scale data according to the characteristics of data in MIL. The contents include: the theoretical analysis and algorithms on bag downsampling in MIL setting; the theories and algorithms on how to get the similarity between two bags represented by graph efficiently; online multiple instance learning algorithm updating with multiple bags simultaneously; Finally, we study how to accelerate the training of MIL methods on large scale image and video data. This project aims to reveal the characteristics of data in MIL setting to provide the theoretical foundation and technological support.

多示例学习近些年来一直是机器学习和数据挖掘领域中的热点问题。但现有的多示例学习方法面对大规模数据时,通常训练所花费的时间以及空间代价过大而无法承受。本课题针对多示例学习中训练集数据本身的特点,研究如何在大规模数据集上进行快速有效训练的多示例学习方法。具体研究内容包括:在多示例学习环境中对以包为单位的数据进行降采样的理论分析以及降采样算法研究;探索以图来表示的两个包如何有效进行比较的理论以及可以快速计算的多示例核函数的算法;研究使用多个包进行对当前预测函数进行一次更新的在线多示例学习算法。最后,我们利用图像和视频数据本身的特点研究如何加速多示例学习的训练。本项目旨在揭示多示例学习环境中训练数据的特点,为能够在大规模数据集上高速有效地进行多示例学习提供理论基础和技术支撑。

项目摘要

多示例学习是机器学习领域的一个重要研究方向。近年来随着信息技术的发展,多示例学习中训练集的数据数量快速增多呈现大规模化的发展方向。很多传统的多示例学习方法在大规模数据进行训练都会遇到训练时间代价过大的问题。本课题主要针对此问题提出了针对若干特定多示例学习问题如何在大规模数据上进行高效训练的算法。其中包括我们提出的在线多示例异常检测算法、仅用正包训练的多示例学习算法以及用于快速检索的多示例哈希算法等。同时我们也运用这些方法的思想较好地解决了一些包括机器人视觉、立体匹配等实际问题。在本课题资助下目前已发表论文7篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
2

基于多色集合理论的医院异常工作流处理建模

基于多色集合理论的医院异常工作流处理建模

DOI:
发表时间:2020
3

基于MCPF算法的列车组合定位应用研究

基于MCPF算法的列车组合定位应用研究

DOI:
发表时间:2016
4

基于腔内级联变频的0.63μm波段多波长激光器

基于腔内级联变频的0.63μm波段多波长激光器

DOI:10.3788/CJL201946.0801003
发表时间:2019
5

结直肠癌免疫治疗的多模态影像及分子影像评估

结直肠癌免疫治疗的多模态影像及分子影像评估

DOI:10.13609/j.cnki.1000-0313.2022.04.019
发表时间:2022

王志岗的其他基金

相似国自然基金

1

面向多示例数据的分类和多序列回归算法研究

批准号:61672169
批准年份:2016
负责人:肖燕珊
学科分类:F0607
资助金额:63.00
项目类别:面上项目
2

面向多示例数据标注的隐变量支持向量机研究

批准号:61202269
批准年份:2012
负责人:温雯
学科分类:F0605
资助金额:23.00
项目类别:青年科学基金项目
3

多示例学习及其应用的研究

批准号:60105004
批准年份:2001
负责人:周志华
学科分类:F0603
资助金额:18.00
项目类别:青年科学基金项目
4

面向大规模数据的机器学习算法研究

批准号:61175050
批准年份:2011
负责人:吴高巍
学科分类:F0603
资助金额:54.00
项目类别:面上项目