基于相似度学习的异构数据聚类算法研究及其应用

基本信息
批准号:61876193
项目类别:面上项目
资助金额:65.00
负责人:王昌栋
学科分类:
依托单位:中山大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:朱俊勇,黄栋,黄玲,张广煜,赵知临,胡琪滢,李娟慧,李佩珍,林坤昱
关键词:
距离多视图相似度学习异质聚类
结项摘要

Heterogeneous data clustering is one of most valuable and challenging tasks in data clustering. The key to heterogeneous data clustering is to extract proximity matrix with higher cluster discriminability on the basis of the combined information from heterogeneous representation spaces, so as to reveal more precisely the cluster structure distribution of the heterogeneous data. In this project, based on representative, spectral embedding, cross-view consistency, motif and modularity, we aim to address the challenging issues associated with heterogeneous data clustering, namely, learning proximity matrix with higher cluster discriminability from heterogeneous data. Accordingly, we will propose proximity learning based heterogeneous data clustering algorithms, including data-manifold proximity learning based multi-view data clustering algorithms, higher-order proximity learning based multi-view network clustering algorithms and higher-order proximity learning based attributed network clustering algorithms, as well as their applications in heterogeneous data based web public opinion analysis, recommendation systems and industrial Internet of things. The project would further enrich the theories and methods of data clustering. In particular, it would enhance the research development of heterogeneous data clustering.

异构数据聚类是数据聚类中最具应用价值同时也是最具挑战性的科学研究问题之一。其关键难题是在有效地融合异构空间信息的基础上,提炼出更具类区分度的相似性矩阵,得到更准确的聚类结果。本项目拟以代表点、谱嵌入、跨视图一致性、模体、模块度等作为理论和技术基础,重点解决异构数据聚类的更具类区分度的相似度学习这一难题,研究建立基于相似度学习的异构数据聚类算法,包括基于样本流形相似度学习的多视图数据聚类算法、基于高阶特征相似度学习的多视图网络聚类算法、基于高阶特征相似度学习的属性网络聚类算法等,并研究这些新算法在融合异构数据的网络舆情分析、商品推荐系统、工业物联网鲁棒性分析等方面的应用。本项目的开展将进一步丰富数据聚类理论和方法,特别是推动异构数据聚类研究的发展。

项目摘要

异构数据聚类是数据聚类中最具应用价值同时也是最具挑战性的科学研究问题之一。其关键难题是在有效地融合异构空间信息的基础上,提炼出更具类区分度的相似性矩阵,得到更准确的聚类结果。本项目以代表点、谱嵌入、跨视图一致性、模体、模块度等作为理论和技术基础,重点解决异构数据聚类的更具类区分度的相似度学习这一难题,研究建立基于相似度学习的异构数据聚类算法,包括基于样本流形相似度学习的多视图数据聚类算法、基于高阶特征相似度学习的多视图网络聚类算法、基于高阶特征相似度学习的属性网络聚类算法等,并研究这些新算法在融合异构数据的网络舆情分析、商品推荐系统、工业物联网鲁棒性分析等方面的应用。本项目一共产出近70篇高水平论文,包括31篇IEEE/ACM Trans等计算机领域的权威期刊论文以及近10篇AAAI、IJCAI等计算机领域的重要学术会议论文,研究成果荣获广东省自然科学奖二等奖。本项目的完成将进一步丰富数据聚类理论和方法,特别是推动异构数据聚类研究的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

EBPR工艺运行效果的主要影响因素及研究现状

EBPR工艺运行效果的主要影响因素及研究现状

DOI:10.16796/j.cnki.1000-3770.2022.03.003
发表时间:2022
2

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
3

基于多色集合理论的医院异常工作流处理建模

基于多色集合理论的医院异常工作流处理建模

DOI:
发表时间:2020
4

基于腔内级联变频的0.63μm波段多波长激光器

基于腔内级联变频的0.63μm波段多波长激光器

DOI:10.3788/CJL201946.0801003
发表时间:2019
5

结直肠癌免疫治疗的多模态影像及分子影像评估

结直肠癌免疫治疗的多模态影像及分子影像评估

DOI:10.13609/j.cnki.1000-0313.2022.04.019
发表时间:2022

王昌栋的其他基金

相似国自然基金

1

复杂结构数据的相似度学习及其应用研究

批准号:61806045
批准年份:2018
负责人:康昭
学科分类:F0603
资助金额:26.00
项目类别:青年科学基金项目
2

面向多源异构流数据的在线聚类集成算法研究及其应用

批准号:61602189
批准年份:2016
负责人:黄栋
学科分类:F0605
资助金额:20.00
项目类别:青年科学基金项目
3

面向复杂数据的稀疏相似度学习方法及其应用

批准号:61075052
批准年份:2010
负责人:黄开竹
学科分类:F0603
资助金额:34.00
项目类别:面上项目
4

基于多关联数据融合的疾病相似度算法研究

批准号:61502125
批准年份:2015
负责人:程亮
学科分类:F0213
资助金额:20.00
项目类别:青年科学基金项目