With the advent of the era of big data and artificial intelligence, data mining techniques are facing challenges with the rapid growing size of data. For large scale data, expensive labeling cost makes it rare to have labeled data in real world applications, therefore it has become an essential demand to develop effective unsupervised learning methods. 2-dimensional (2D) data are becoming increasingly common in real world applications, meanwhile the current methods usually need to apply vectorization to 2D data which is problematic in that it damages spatial information of original data. To solve this problem, in this project, we will study clustering algorithms for 2D data, which includes: studying novel algorithms in a new category which can preserve spatial information from original data and simultaneously extract the most representative features and learn clustering structure, and designing linear and nonlinear models for 2D subspace clustering and producing theoretical analysis. This research project will enrich the field of clustering 2D data, which is academically significant.
随着大数据和人工智能时代的来临,急速膨胀的数据规模在实际应用对数据挖掘技术提出了严峻的挑战。对于大规模数据,高昂的标记成本导致了人们在实际问题中往往面临无标记的数据,因此发展有效的无监督学习方法成为数据挖掘领域的基本需求。与此同时,二维数据在实际问题中的使用日益广泛,而当前的学习算法在面临二维数据时通常需要将数据向量化,导致了原始二维数据空间结构信息的损坏,存在严重的缺陷。为解决这一问题,本项目将研究一类面向二维数据的聚类算法,主要研究内容包括:研究一类新型算法能够保存二维数据的空间信息并同时学习数据最具表达的特征与类结构信息,设计线性和非线性二维子空间聚类算法并进行理论分析。本项目的研究将进一步完善面向二维数据的聚类学习研究,具有重要的学术意义。
随着大数据和人工智能时代的来临,急速膨胀的数据规模在实际应用对数据挖掘技术提出了严峻的挑战。对于大规模数据,高昂的标记成本导致了人们在实际问题中往往面临无标记的数据,因此发展有效的无监督学习方法成为数据挖掘领域的基本需求。与此同时,二维数据在实际问题中的使用日益广泛,而当前的学习算法在面临二维数据时通常需要将数据向量化,导致了原始二维数据空间结构信息的损坏,存在严重的缺陷。为解决这一问题,本项目将研究一类面向二维数据的聚类算法,主要研究内容包括:研究一类新型算法能够保存二维数据的空间信息并同时学习数据最具表达的特征与类结构信息,设计线性和非线性二维子空间聚类算法并进行理论分析。本项目的研究将进一步完善面向二维数据的聚类学习研究,具有重要的学术意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
EBPR工艺运行效果的主要影响因素及研究现状
基于铁路客流分配的旅客列车开行方案调整方法
一种基于多层设计空间缩减策略的近似高维优化方法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例
面向社会媒体数据的子空间聚类算法研究
面向高光谱图像的局部多流形结构保持稀疏子空间聚类算法研究
多粒度视角下大规模数据聚类算法研究
大规模数据聚类的并行进化算法骨架研究