基于自步学习的多任务聚类算法研究

基本信息

批准号：61806043

项目类别：青年科学基金项目

资助金额：26.00

负责人：任亚洲

学科分类：

依托单位：电子科技大学

批准年份：2018

结题年份：2021

起止时间：2019-01-01 - 2021-12-31

项目状态：已结题

项目参与者：李建福,赵鹏,黄树东,阙晓凡,郭子毅,张选杨,徐菁

关键词：

自步学习深入嵌入聚类多任务聚类多视图聚类

结项摘要

In recent years, multi-task clustering has attracted a lot of research attentions in machine learning due to its ability in improving the clustering performance by learning multiple learning tasks jointly and simultaneously. Despite the success of traditional multi-task clustering models, they typically solve a non-convex optimization problem and thus are easy to stuck into local optima. In addition, they are sensitive to noisy data and outliers. Self-paced learning is an emerging machine learning method for solving non-convex optimization problems. This project will propose novel multi-task clustering models based on self-paced learning. Specifically, the research mainly focuses on the following aspects: (1) A self-paced multi-task clustering model is studied, which uses self-paced learning to select data examples with increasing complexity to train multi-task models, and uses soft weighting scenario to reduce the impact of noisy data and outliers; (2) Study a self-paced multi-task deep embedded clustering model, which uses deep neural network to obtain better representation learning ability and to further improve the clustering performance; (3) For clustering problem with multiple views for each task, a self-paced multi-task multi-view clustering model is studied to effectively utilize the relationships among both tasks and views. This project provides new ideas and methods for the study of multi-task clustering. The proposed models will be used in image clustering, text clustering, and data analysis of Alzheimer's disease, which has important theoretical and practical value.

多任务聚类能够同时学习多个任务来提升聚类性能，近年来在机器学习领域引起了很多关注。尽管已有多任务聚类模型取得了成功，但它们往往求解一个非凸优化问题而容易陷入局部最优，而且他们对噪声数据和离群点敏感。自步学习是一种新兴的用于解决非凸优化问题的机器学习方法。本项目将基于自步学习提出新的多任务聚类模型。具体研究内容：（1）研究一种自步多任务聚类模型，利用自步学习从易到难地选择样本进行多任务模型的训练，并使用软赋权方法减小噪声数据和离群点的影响。（2）研究一种自步多任务深度嵌入聚类模型，利用深度神经网络获取更强的表征学习能力，以进一步提升聚类性能。（3）针对每个任务存在多个视图的聚类问题，研究一种自步多任务多视图聚类模型，以有效地利用任务之间以及视图之间的关系。本项目为多任务聚类的研究提供了新的理念与方法，提出的模型将用于图像聚类、文本聚类以及阿兹海默病的数据分析中，具有重要的理论意义和实际价值。

项目摘要

多任务聚类由于求解非凸优化问题而容易陷入局部最优解，而且已有模型对噪声数据和离群点敏感。自步学习是一种解决非凸优化问题、提升模型泛化能力的机器学习方法。为此，本项目主要研究基于自步学习的多任务聚类方法，取得了以下成果：（1）针对单任务单视图聚类，提出了并行聚类、半监督深度嵌入聚类、基于层次特征采样的半监督集成聚类等新模型；（2）针对自步多视图聚类，提出了自步多视图聚类、自步自动赋权的多视图聚类、自步多视图聚类的非线性融合、双向自步多视图聚类等模型；（3）针对自步多任务聚类，提出了自步多任务聚类算法；（4）针对自步多任务多视图聚类，设计了基于capped-norm的自步多任务多视图聚类方法；（5）深度学习理论研究方面，提出了基于密度的深度图像聚类、基于协同训练的深度多视图聚类、基于变分自编码器的多视图聚类、深度不完全多视图聚类等模型。所有方法实验评测结果均为优良。本项目在TGRS、Neural Networks、KBS、Information Sciences、Neurocomputing等期刊，以及AAAI、ICCV、ACM MM、ICONIP、ISICDM等会议上发表高水平论文21篇，申报2项专利，超额完成了既定任务。本项目为多任务聚类、多视图聚类与自步学习的研究提供了新的理念与方法，提出的模型可用于图像聚类、文本聚类以及医学大数据分析中，具有重要的理论意义和应用前景。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

任亚洲的其他基金

相似国自然基金

面向流式数据的在线自步多任务特征学习研究

批准号：61806044

批准年份：2018

负责人：李长升

学科分类：F0603

资助金额：26.00

项目类别：青年科学基金项目

基于相似度学习的异构数据聚类算法研究及其应用

批准号：61876193

批准年份：2018

负责人：王昌栋

学科分类：F0603

资助金额：65.00

项目类别：面上项目

基于抑制式竞争学习机制的模糊聚类算法研究

批准号：61340040

批准年份：2013

负责人：范九伦

学科分类：F0605

资助金额：18.00

项目类别：专项基金项目

基于迁移学习的智能多任务高性能优化算法研究

批准号：61876025

批准年份：2018

负责人：冯亮

学科分类：F0601

资助金额：62.00

项目类别：面上项目

基于自步学习的多任务聚类算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

任亚洲的其他基金

相似国自然基金