高维数据处理能力是聚类研究的难点之一。本项目拟针对高维数据普遍具有稀疏特征,提出特定的高维数据表示、数据精简和差异度计算方法,并进一步给出高效的不同数据类型的聚类算法。主要研究内容包括:.(1)高维稀疏数据的特征表示和基本性质、针对高维稀疏数据聚类的更高效更高质量的缺失数据填补方法和数据取值类型转换方法。.(2)在保留全部原有数据信息或至少保留聚类相关信息的情况下,高维稀疏数据的精简方法、存在缺失数据的高维稀疏数据精简方法、兼顾缺失数据填补的高维稀疏数据精简方法。.(3)不同数据类型的高维稀疏数据集合差异度计算方法。针对高维稀疏数据聚类,从根本上解决差异度计算问题,为高效聚类算法的提出提供理论依据。.(4)不同数据类型的高维稀疏数据聚类算法。
{{i.achievement_title}}
数据更新时间:2023-05-31
Shrinkage and strength development of UHSC incorporating a hybrid system of SAP and SRA
Spray impingement wall film breakup by wave entrainment
Growing season carries stronger contributions to albedo dynamics on the Tibetan plateau
CFD investigation on dust dispersion pollution of down/upwind coal cutting and relevant countermeasures for spraying dustfall in fully mechanized mining face
Dynamic behaviors of protein and starch and interactions associated with glutenin composition in wheat dough matrices during sequential thermo-mechanical treatments
聚类导向的字典学习及基于稀疏表示的高维数据聚类研究
高维数据非负稀疏特征抽取及聚类算法研究
基于约束的高维数据聚类
面向高维数据集成降维的半监督聚类方法研究