With the rapid increase of information and the improvement of measurements, many research objects can be described by information from multiple perspectives. Although the multi-view data can bring us richer and more comprehensive information, it is together with the heterogeneity of data structure and large storage and computation complexity. How to utilize the multi-view information for more precise and efficient data clustering is one of the fundamental problems in the development of multi-source data fusion technologies. With the combination of therotical researches, algorithm studies, and practical applications, this project will tackle the existing theoretical and application problems with multi-view clustering, mainly aiming at addressing the following three aspests: (1) based on preserving the multi-view data structure, we will study the regularized coupled matrix/tensor decomposition based model for multi-view clustering and its well-posed properities; (2) based on the splitting philosophy, we will study the practical high-performance algorithms for multi-view data clustering and its convergence properities; (3) based on the mutual verification of both theoretical analysis and numerical simulations, we will study the autonomous parameters optimization mechanism for multi-view clustering model. On the basis of the aforementioned works, we will further develop the Matlab package for multi-view clustering. The successful implementation of this project will be important for both academical and practical developments in the field of computational mathematics as well as computer science.
随着信息获取渠道的增多及测量手段的不断提高,人们可以通过多角度信息对研究对象进行描述。多视角数据在带来更丰富,更完备信息的同时,也伴随着数据结构性差异大,存储运算复杂等问题。合理地利用多视角信息实现精准化、高效化的数据聚类是多源数据融合技术发展中需要迫切解决的基础性问题之一。本项目将采用理论、算法、应用三个方面来研究多视角聚类中存在的问题,拟研究以下三个方向:(1)基于多视角数据结构信息保真,研究基于正则化联合矩阵/张量分解的多视角聚类数学模型及其适定性问题;(2)基于分而治之的分裂思想,研究适用于大规模多视角数据的高性能聚类算法及其收敛特性;(3)基于理论分析和数值模拟的相互验证,研究多视角聚类模型中自主化参数优选机制。上述工作基础上,将进一步研制多视角数据聚类Matlab测试软件包,发布给学术界做进一步研究之用。
随着信息获取渠道的增多及测量手段的不断提高,人们可以通过多角度信息对研究对象进行描述。多视角数据在带来更丰富,更完备信息的同时,也伴随着数据结构性差异大,存储运算复杂等问题。合理地利用多视角信息实现精准化、高效化的数据聚类是多源数据融合技术发展中需要迫切解决的基础性问题之一。本项目将采用理论、算法、应用三个方面来研究多视角聚类中存在的问题,拟研究以下三个方向:(1)基于多视角数据结构信息保真,研究基于正则化联合矩阵/张量分解的多视角聚类数学模型及其适定性问题;(2)基于分而治之的分裂思想,研究适用于大规模多视角数据的高性能聚类算法及其收敛特性;(3)基于理论分析和数值模拟的相互验证,研究多视角聚类模型中自主化参数优选机制。.基于以上研究内容,本项目针对多视角高维数据的相关特点及聚类问题特点,设计了一系列基于矩阵及张量分解架构的数学模型并设计相应的优化计算算法;针对网络数据,时序数据等其他类型数据下的聚类分类、推断预测任务等其他实际问题,提出基于矩阵分解及深度神经网络的数学模型。项目组累计发表学术论文17篇。相关成果可应用于多视角及其他类型数据的聚类任务中,在金融反欺诈等领域具有应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
miR-126-5p通过DLK1/Akt/eNOS通路促进血管新生治疗慢性缺血性脑血管病的作用与机制
矩阵恢复的稀疏正则化算法及其应用
总变差正则化模型的区域分解算法及其医学图像应用
张量分解方法及其在医学成像中的应用
基于低秩和图正则约束的矩阵分解方法研究及在癌症多组学数据中的应用