Copula is one of the most newest research topics in the fields of both statistical data analysis and machine learning. It uses random variable transformation to characterize the correlation directly and provides a new way in analyzing correlated data. This project aims at analyzing high dimensional correlated data by copula model from three aspects, i.e., in theory, methodology and application. In theoretical aspect, we will discuss the essence why copula can characterize correlations among high dimensional data. The estimation problem in copula model will also be investigated. In methdology, we will try to construct copula for high dimensional correlatd data based on dimensionality reduction strategy. Besides, by using previous constructed copula, we will also investigate the problem of classification in weak-supervised condition. In applications, according to our previous results on copula, we will dedicate to the problem of web text data filtering, together with the problem of biological image data classification. The above three aspects are tightly related. The researches in theory and methodology can provide useful guidance for applications. The researches in applications can provide real background for theoretical and methodological investigations. The works in this project can not only extend the research areas of traditional machine learning, but also provide meaningful guidance for the solution to problems in real applications.
关联结构是近年来统计数据分析和机器学习中出现的一个新的研究课题,它通过随机变量的变换直接描述相关性,为相关数据的分析提供了一条崭新的思路。本项目以高维相关数据分析为背景,针对关联结构的理论、方法和应用问题开展研究。理论上主要探讨关联结构描述高维相关数据相关性的机理以及关联结构中典型统计量的估计问题。方法上,一方面,研究基于维数约简的高维相关数据关联结构构建方法,另一方面,根据已构建的关联结构,研究基于关联结构的弱监督分类方法。应用中,依据关联结构,主要研究高维互联网网页文本数据筛选和生物图像数据分类两个具体问题。这三个部分紧密相连,理论和方法研究为应用研究提供指导,应用研究为理论和方法研究提供背景。课题研究不仅能够丰富和拓展机器学习的理论和方法,同时对于解决实际中许多具体应用问题也有重要的指导意义。
高维数据特征之间的关系描述是国际机器学习界的重要研究课题,相关技术广泛应用于文档分类、图像分类、信息检索等领域。本项目围绕描述高维数据关系的关联结构及在此基础上的方法设计和实际应用问题开展研究,完成了原定研究计划,主要取得了以下成果:(1) 为了应对开放环境对高维数据分析提出的新挑战,采用关联结构描述特征关系,提出了弱监督鲁棒学习系列方法;(2) 为了减轻维数升高带来的维数灾难问题,基于关联结构,提出了高维数据维数约简系列方法;(3) 为了应对高维数据维数升高会带来计算量激增的问题,提出了能够快速进行高维数据分类的基于特征关系的高维数据分类方法;(4) 面向国家军事需求,开展了多项高维数据处理方法在军事应用领域的创新研究,有效性地解决了应用中的一些关键问题,已发挥了显著的军事效益。本课题共发表/录用论文26篇,其中SCI检索17篇。其中,CCF A 类期刊/会议(TPAMI、TIP、TKDE、AAAI)8 篇;B 类期刊/会议(TCYB、TNNLS/TNN、ICDM)6篇。IEEE 汇刊(TPAMI、TIP、TKDE、TCYB、TNNLS/TNN)长文12篇。本项目成果已经引起国际同行的广泛关注,引用源包括IEEE TPAMI、IEEE TKDE、IEEE TIP、KDD、AAAI、IJCAI等。培养了多名研究生。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
高维数据的几何结构分析
高维数据的稳健统计分析及相关问题
高维混合非线性结构数据分析及其应用
高维复杂结构数据降维