Due to an explosion of big data from all fields of science, there is an increasing need for computational and statistical techniques and tools for data analytics, recognition, learning with relatively limited samples in high dimensions..The overall objective of this research is to develop transformative algorithms and theories for selection/projection based dimension reduction for machine learning with applications in large-scale image and video analysis. We tackle the challenges arising from sparse representation, low rank matrix recovery, robust analysis and outlier detection, clustering analysis, missing values, nonconvex optimization in massive datasets..In this project, research will be conducted in the following five topics: (i) robust subspace estimation and low rank multi-data registration, (ii) video analysis by overcomplete dictionary learning, (iii) simultaneous variable selection and low rank estimation with operator splitting, (iv) progressive variable screening in very high dimensions, (v) image and video analyses with simultaneous feature selection and extraction..The new theories, algorithms and applications developed in this project will serve as foundations in big image/video analytics and well suit the practical needs of big data applications. They will revolutionize and broaden existing algorithms and theories in the areas of robust PCA, feature extraction, variable selection and screening, object detection, recognition and retrieval, anomaly detection and accommodation with big data applications in images and videos.
伴随着数据量的急剧增加,迫切需要从高维空间相对有限的样本中进行数据分析、识别和学习的统计计算方法和实用工具。.本项目的总体目标是开发机器学习中选择和投影的降维理论和算法以及在海量图像视频分析中的应用,用于实现在海量数据中的稀疏表示、低秩矩阵恢复、鲁棒分析和野点检测、聚类分析、缺失值恢复和非凸优化。.项目重点研究:1、低秩约束子空间恢复和多图像鲁棒配准;2、 稀疏正则化的字典学习; 3 、同步变量选择和低秩估计; 4、 高维数据的渐进变量筛选; 5、同步特征选择和提取算法在图像视频分析中的应用等。.项目成果将在现有鲁棒PCA、特征提取、变量选择和筛选、物体检测、识别和检索、异常事件检测等方面有较大的突破和创新,以解决一些海量数据分析,特别是图像视频分析应用中急待解决的问题。
本项目的目标是研发机器学习中降维理论和算法以及在图像视频分析中的应用,用于实现在海量数据中的稀疏表示、低秩矩阵恢复和鲁棒分析,提高智能视频分析系统的实时性、准确性和适应性。.按照预定的研究计划,项目取得了如下研究成果:.1.提出了一种联合低秩的判别性特征学习方法。该方法提出了一种融合特征学习和分类器学习的低秩特征学习模型,设计实现了一种高效的优化算法,并在理论上证明了其收敛性。针对规模较大的数据集,利用一种随机采样的方法设计了一种快速算法。大量多个的实验证明了该方法的优异的分类性能。.2.设计了一种处理数据中结构性噪声的字典学习方法。该方法通过将数据分解为干净数据、结构性噪声以及高斯噪声,并通过不同方法刻画其不同特性,因此能够更加准确地刻画数据。另外,设计实现了一种求解该数学模型的高效优化算法,并在理论上证明了其收敛性。实验证明了该方法的有效性和鲁棒性。.3.针对高维数据快速检索问题,我们提出一个全新的无监督训练编码网络的框架,其首先结合样本在各种模态表示下的相似性关系,挖掘出深层的语义关联,然后作为监督信号促使网络生成满足上述语义关系的二值编码,最大化保留样本间的原始近邻关系,从而取得了优越的跨模态检索性能。.4.提出了一种即插即用的行人再识别双路对齐模块,利用行人分割和自注意力机制能够同时提取人体和其附属物的关键特征,增强了目标特征表达的区分性提出一种稀疏交替自注意力模块,将原始稠密的相似度矩阵分解为两个稀疏低秩的相似度矩阵,大大减少了模型参数量,加速了算法运行速度,同时还能产生高质量的特征图。在多个行人再识别数据集上实验验证了所设计模块的有效性。.项目的研究可以有效提升智能视频分析检索系统的性能,部分相关成果已经应用于实际智能视频分析系统中。.项目期间7名硕士生毕业,在国际期刊和重要国际会议发表论文 17 篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
稀疏表示和正则化方法在图像语义分析中的应用研究
L(1/2)正则化研究及其在压缩传感与特征选择中的应用
由投影重建图像的全变分正则化数值方法
Hardy空间和BMO空间混合范数组稀疏正则化及其在图像复原中的应用