基于相似度学习的异构数据聚类算法研究及其应用

基本信息
批准号:61876193
项目类别:面上项目
资助金额:65.00
负责人:王昌栋
学科分类:
依托单位:中山大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:朱俊勇,黄栋,黄玲,张广煜,赵知临,胡琪滢,李娟慧,李佩珍,林坤昱
关键词:
距离多视图相似度学习异质聚类
结项摘要

Heterogeneous data clustering is one of most valuable and challenging tasks in data clustering. The key to heterogeneous data clustering is to extract proximity matrix with higher cluster discriminability on the basis of the combined information from heterogeneous representation spaces, so as to reveal more precisely the cluster structure distribution of the heterogeneous data. In this project, based on representative, spectral embedding, cross-view consistency, motif and modularity, we aim to address the challenging issues associated with heterogeneous data clustering, namely, learning proximity matrix with higher cluster discriminability from heterogeneous data. Accordingly, we will propose proximity learning based heterogeneous data clustering algorithms, including data-manifold proximity learning based multi-view data clustering algorithms, higher-order proximity learning based multi-view network clustering algorithms and higher-order proximity learning based attributed network clustering algorithms, as well as their applications in heterogeneous data based web public opinion analysis, recommendation systems and industrial Internet of things. The project would further enrich the theories and methods of data clustering. In particular, it would enhance the research development of heterogeneous data clustering.

异构数据聚类是数据聚类中最具应用价值同时也是最具挑战性的科学研究问题之一。其关键难题是在有效地融合异构空间信息的基础上,提炼出更具类区分度的相似性矩阵,得到更准确的聚类结果。本项目拟以代表点、谱嵌入、跨视图一致性、模体、模块度等作为理论和技术基础,重点解决异构数据聚类的更具类区分度的相似度学习这一难题,研究建立基于相似度学习的异构数据聚类算法,包括基于样本流形相似度学习的多视图数据聚类算法、基于高阶特征相似度学习的多视图网络聚类算法、基于高阶特征相似度学习的属性网络聚类算法等,并研究这些新算法在融合异构数据的网络舆情分析、商品推荐系统、工业物联网鲁棒性分析等方面的应用。本项目的开展将进一步丰富数据聚类理论和方法,特别是推动异构数据聚类研究的发展。

项目摘要

异构数据聚类是数据聚类中最具应用价值同时也是最具挑战性的科学研究问题之一。其关键难题是在有效地融合异构空间信息的基础上,提炼出更具类区分度的相似性矩阵,得到更准确的聚类结果。本项目以代表点、谱嵌入、跨视图一致性、模体、模块度等作为理论和技术基础,重点解决异构数据聚类的更具类区分度的相似度学习这一难题,研究建立基于相似度学习的异构数据聚类算法,包括基于样本流形相似度学习的多视图数据聚类算法、基于高阶特征相似度学习的多视图网络聚类算法、基于高阶特征相似度学习的属性网络聚类算法等,并研究这些新算法在融合异构数据的网络舆情分析、商品推荐系统、工业物联网鲁棒性分析等方面的应用。本项目一共产出近70篇高水平论文,包括31篇IEEE/ACM Trans等计算机领域的权威期刊论文以及近10篇AAAI、IJCAI等计算机领域的重要学术会议论文,研究成果荣获广东省自然科学奖二等奖。本项目的完成将进一步丰富数据聚类理论和方法,特别是推动异构数据聚类研究的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021

王昌栋的其他基金

相似国自然基金

1

复杂结构数据的相似度学习及其应用研究

批准号:61806045
批准年份:2018
负责人:康昭
学科分类:F0603
资助金额:26.00
项目类别:青年科学基金项目
2

面向多源异构流数据的在线聚类集成算法研究及其应用

批准号:61602189
批准年份:2016
负责人:黄栋
学科分类:F0605
资助金额:20.00
项目类别:青年科学基金项目
3

面向复杂数据的稀疏相似度学习方法及其应用

批准号:61075052
批准年份:2010
负责人:黄开竹
学科分类:F0603
资助金额:34.00
项目类别:面上项目
4

基于多关联数据融合的疾病相似度算法研究

批准号:61502125
批准年份:2015
负责人:程亮
学科分类:F0213
资助金额:20.00
项目类别:青年科学基金项目