基于PAC理论的标签比例学习算法研究

基本信息

批准号：61702099

项目类别：青年科学基金项目

资助金额：18.00

负责人：汪波

学科分类：

依托单位：对外经济贸易大学

批准年份：2017

结题年份：2020

起止时间：2018-01-01 - 2020-12-31

项目状态：已结题

项目参与者：佟强,屈启兴,齐志泉,陈振松,孟凡

关键词：

多示例学习直推学习标签比例学习半监督分类

结项摘要

Different from traditional supervised learning, learning from label proportions (LLPs), which seeks generalized instance-level predictors merely based on bag-level label proportions, has attracted widespread interest. However, due to its weak label scenario, LLP usually falls into a transductive learning framework accounting for an intractable combinatorial optimization issue. In this project, we try to apply probably approximately correct (PAC) to this special problem and construct the learnable algorithm for LLP. In detail, we will estimate the sample complexity of LLP to verify the correctness of proposed algorithm. In addition, we will study on the construction of models in dealing with LLP. Firstly, we extend the former work in SVM based LLP solver to nonparallel support vector machine based model, proposing a brand new algorithm to facilitate the mixed integer programming. To harness satisfactory data adaption, Laplace regularization is applied to our learning models. Secondly, we will extend LLP to a more universal framework named learning from bounded label proportions (BLP). In this situation, the real-valued proportions are replaced with interval-valued ones, which show a number of apparent applications in real life. Finally, extremely rapid algorithms will be analyzed to equip for solving BLP problems.

与传统监督学习不同，包学习基于包层面的标签信息和包中样本的属性信息，训练学习分类器，是一种在弱化的样本类标下的有监督学习．与经典的包学习问题多示例学习不同，标签比例学习的特点在于，样本类标以包中正负样本的比例信息体现．很多实际问题，如选举的地域得票率、流行病地区发病率等，都可以抽象纳入标签比例学习的框架中，这体现了其广泛的应用前景和重要的实践价值．将比例信息作为多示例学习中包标签信息的推广，借鉴其研究思路，本项目对标签比例学习研究方法进行探索，在构建相关概率近似正确学习理论的基础上，结合间隔学习和半监督问题的正则化方法，提出并发展一系列基于支持向量机求解标签比例学习问题的模型，并通过引入Laplace正则项，借助样本边际分布的流形信息，达到更为有效分类预测的目标．进一步，本项目对标签比例学习问题的框架进行拓展，提出适用范围更广的区间值标签比例学习框架，并探索快速求解方法．

项目摘要

在基于深度学习的大数据时代，获得样本级别的监督信息十分困难。标签比例学习作为一种典型的弱标签学习任务，利用样本分包后的包层面标签比例信息，构建学习模型，最终获得样本层面的分类器。本项目旨在研究标签比例学习PAC理论研究，开发多种标签比例学习方法，并设计高效求解该问题的快速算法。针对上述问题，本项目取得了如下的研究成果。首先，我们基于大间隔学习理论和Laplace正则化技术，构建了标签比例学习的LapESVR模型。其次，我们基于随机森林和极限学习机等经典的浅模型技术，构建了处理高维标签比例学习的LLP-RF模型和能够快速求解标签比例学习的LLP-ELM算法。然后，我们根据弱标签问题自身标签信息严重缺失的特性，利用深度学习的表示学习框架，借助对抗学习思想，构建了基于生成对抗网络的标签比例学习模型LLP-GAN，取得了超越现存所有LLP问题求解器的最佳性能。此外，我们还进一步发掘其它标签比例学习形式的拓展，即利用少量有标记样本，结合大量标签比例数据，构建LLP-LS模型，进一步提升了标签比例学习的性能，拓宽了该问题的应用场景。最后，我们还将所构建的LLP模型应用于经济金融领域的诸多现实问题中，展示了我们的研究具有良好的应用前景。除此之外，我们还在计算机视觉的其它领域，如图像超分辨率和边缘检测等实际问题上，取得了有价值的进展。这些工作将进一步促进LLP研究在计算机视觉领域的应用。总体来说，项目的研究成果提供了大量标签比例学习模型和快速求解算法，同时为其它弱监督学习问题的研究提供了可行的思路和手段，在理论、建模、算法和实践等方面都取得了实质性的突破。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：10.7641/CTA.2018.70969

发表时间：2018

汪波的其他基金

批准号：31100736

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

批准号：81601446

批准年份：2016

资助金额：17.50

项目类别：青年科学基金项目

批准号：81603246

批准年份：2016

资助金额：18.00

项目类别：青年科学基金项目

批准号：51878571

批准年份：2018

资助金额：61.00

项目类别：面上项目

批准号：31171594

批准年份：2011

资助金额：65.00

项目类别：面上项目

批准号：61471011

批准年份：2014

资助金额：70.00

项目类别：面上项目

批准号：21272290

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：31671736

批准年份：2016

资助金额：64.00

项目类别：面上项目

批准号：51378434

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：11401206

批准年份：2014

资助金额：22.00

项目类别：青年科学基金项目

批准号：30800696

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：51907028

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：11771137

批准年份：2017

资助金额：48.00

项目类别：面上项目

批准号：51578456

批准年份：2015

资助金额：57.00

项目类别：面上项目

批准号：11341002

批准年份：2013

资助金额：10.00

项目类别：专项基金项目

相似国自然基金

标签推荐系统中基于深度学习和多目标优化的推荐算法研究

批准号：61902117

批准年份：2019

负责人：左益

学科分类：F0214

资助金额：25.00

项目类别：青年科学基金项目

基于标签分布学习的弱监督图像情感识别研究

批准号：61876094

批准年份：2018

负责人：杨巨峰

学科分类：F0604

资助金额：64.00

项目类别：面上项目

机器学习算法的margin理论

批准号：61375051

批准年份：2013

负责人：林通

学科分类：F0603

资助金额：79.00

项目类别：面上项目

基于用户评价准则的排序学习算法及理论研究

批准号：61203298

批准年份：2012

负责人：兰艳艳

学科分类：F0603

资助金额：26.00

项目类别：青年科学基金项目

基于PAC理论的标签比例学习算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

具有随机多跳时变时延的多航天器协同编队姿态一致性

汪波的其他基金

情绪对情景记忆巩固的影响机制

一种新型间日疟疫苗候选抗原：受感染红细胞表膜相关分子PvTRAg-26/ 29免疫原性及免疫效果研究

基于大黄叶绿体基因组高变区分析鉴定机理研究

基于主动-释能理念的隧道岩爆防治机理及其支护技术研究

干旱胁迫下苎麻表达谱研究及抗旱基因的克隆

低功耗自适应极简人体通信收发机

新型α-葡萄糖苷酶抑制剂呫吨衍生物的结构优化与协同作用

苎麻韧皮部特异/优势启动子克隆与功能验证

震裂岩体隧道灾变失稳机理及安全控制对策

求解界面问题的扩展杂交间断伽略金方法及其在流体界面问题中的应用

苎麻抗炭疽病相关基因的克隆和功能分析

多三相分数槽集中绕组永磁磁阻容错电机驱动系统关键技术研究

三角形/四面体杂交间断谱元法及其预处理子研究

挤压型大变形隧道中基于让压原理的支护理论与设计方法研究

Hybridizable间断谱元方法及其在波散射问题中的应用

相似国自然基金