基于自步学习的多任务聚类算法研究

基本信息
批准号:61806043
项目类别:青年科学基金项目
资助金额:26.00
负责人:任亚洲
学科分类:
依托单位:电子科技大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:李建福,赵鹏,黄树东,阙晓凡,郭子毅,张选杨,徐菁
关键词:
自步学习深入嵌入聚类多任务聚类多视图聚类
结项摘要

In recent years, multi-task clustering has attracted a lot of research attentions in machine learning due to its ability in improving the clustering performance by learning multiple learning tasks jointly and simultaneously. Despite the success of traditional multi-task clustering models, they typically solve a non-convex optimization problem and thus are easy to stuck into local optima. In addition, they are sensitive to noisy data and outliers. Self-paced learning is an emerging machine learning method for solving non-convex optimization problems. This project will propose novel multi-task clustering models based on self-paced learning. Specifically, the research mainly focuses on the following aspects: (1) A self-paced multi-task clustering model is studied, which uses self-paced learning to select data examples with increasing complexity to train multi-task models, and uses soft weighting scenario to reduce the impact of noisy data and outliers; (2) Study a self-paced multi-task deep embedded clustering model, which uses deep neural network to obtain better representation learning ability and to further improve the clustering performance; (3) For clustering problem with multiple views for each task, a self-paced multi-task multi-view clustering model is studied to effectively utilize the relationships among both tasks and views. This project provides new ideas and methods for the study of multi-task clustering. The proposed models will be used in image clustering, text clustering, and data analysis of Alzheimer's disease, which has important theoretical and practical value.

多任务聚类能够同时学习多个任务来提升聚类性能,近年来在机器学习领域引起了很多关注。尽管已有多任务聚类模型取得了成功,但它们往往求解一个非凸优化问题而容易陷入局部最优,而且他们对噪声数据和离群点敏感。自步学习是一种新兴的用于解决非凸优化问题的机器学习方法。本项目将基于自步学习提出新的多任务聚类模型。具体研究内容:(1)研究一种自步多任务聚类模型,利用自步学习从易到难地选择样本进行多任务模型的训练,并使用软赋权方法减小噪声数据和离群点的影响。(2)研究一种自步多任务深度嵌入聚类模型,利用深度神经网络获取更强的表征学习能力,以进一步提升聚类性能。(3)针对每个任务存在多个视图的聚类问题,研究一种自步多任务多视图聚类模型,以有效地利用任务之间以及视图之间的关系。本项目为多任务聚类的研究提供了新的理念与方法,提出的模型将用于图像聚类、文本聚类以及阿兹海默病的数据分析中,具有重要的理论意义和实际价值。

项目摘要

多任务聚类由于求解非凸优化问题而容易陷入局部最优解,而且已有模型对噪声数据和离群点敏感。自步学习是一种解决非凸优化问题、提升模型泛化能力的机器学习方法。为此,本项目主要研究基于自步学习的多任务聚类方法,取得了以下成果:(1)针对单任务单视图聚类,提出了并行聚类、半监督深度嵌入聚类、基于层次特征采样的半监督集成聚类等新模型;(2)针对自步多视图聚类,提出了自步多视图聚类、自步自动赋权的多视图聚类、自步多视图聚类的非线性融合、双向自步多视图聚类等模型;(3)针对自步多任务聚类,提出了自步多任务聚类算法;(4)针对自步多任务多视图聚类,设计了基于capped-norm的自步多任务多视图聚类方法;(5)深度学习理论研究方面,提出了基于密度的深度图像聚类、基于协同训练的深度多视图聚类、基于变分自编码器的多视图聚类、深度不完全多视图聚类等模型。所有方法实验评测结果均为优良。本项目在TGRS、Neural Networks、KBS、Information Sciences、Neurocomputing等期刊,以及AAAI、ICCV、ACM MM、ICONIP、ISICDM等会议上发表高水平论文21篇,申报2项专利,超额完成了既定任务。本项目为多任务聚类、多视图聚类与自步学习的研究提供了新的理念与方法,提出的模型可用于图像聚类、文本聚类以及医学大数据分析中,具有重要的理论意义和应用前景。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

EBPR工艺运行效果的主要影响因素及研究现状

EBPR工艺运行效果的主要影响因素及研究现状

DOI:10.16796/j.cnki.1000-3770.2022.03.003
发表时间:2022
2

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
3

基于多色集合理论的医院异常工作流处理建模

基于多色集合理论的医院异常工作流处理建模

DOI:
发表时间:2020
4

基于腔内级联变频的0.63μm波段多波长激光器

基于腔内级联变频的0.63μm波段多波长激光器

DOI:10.3788/CJL201946.0801003
发表时间:2019
5

结直肠癌免疫治疗的多模态影像及分子影像评估

结直肠癌免疫治疗的多模态影像及分子影像评估

DOI:10.13609/j.cnki.1000-0313.2022.04.019
发表时间:2022

任亚洲的其他基金

相似国自然基金

1

面向流式数据的在线自步多任务特征学习研究

批准号:61806044
批准年份:2018
负责人:李长升
学科分类:F0603
资助金额:26.00
项目类别:青年科学基金项目
2

基于相似度学习的异构数据聚类算法研究及其应用

批准号:61876193
批准年份:2018
负责人:王昌栋
学科分类:F0603
资助金额:65.00
项目类别:面上项目
3

基于抑制式竞争学习机制的模糊聚类算法研究

批准号:61340040
批准年份:2013
负责人:范九伦
学科分类:F0605
资助金额:18.00
项目类别:专项基金项目
4

基于迁移学习的智能多任务高性能优化算法研究

批准号:61876025
批准年份:2018
负责人:冯亮
学科分类:F0601
资助金额:62.00
项目类别:面上项目