基于Universum学习的降维方法研究

基本信息

批准号：61403193

项目类别：青年科学基金项目

资助金额：24.00

负责人：陈晓红

学科分类：

依托单位：南京航空航天大学

批准年份：2014

结题年份：2017

起止时间：2015-01-01 - 2017-12-31

项目状态：已结题

项目参与者：王丽平,沙春林,田青,黄飞虎,马迪,周航星

关键词：

多视图数据半监督学习Universum监督学习学习数据降维

结项摘要

Dimensionality reduction for high-dimensional data is one of the key contents in pattern recognition since such data widely exist in various application domains. A lot of dimensionality reduction methods have been proposed. However, most of them only utilize the samples related with the tasks for training and ignore Universum samples – the samples that belong to the same application domain as the training data, but do not belong to either class of interest. Recently, based on Universum samples,Universum learning has been used for classification and clustering and improves the algorithmic performance with the help of Universum. In this project, we extend universum learning to dimensionality reduction with the aim of 1) Developing a genera dimensionality reduction framework by taking advantage of Universum and designing supervised and semi-supervised DR methods respectively; 2) Discussing the impact of Universum samples and adaptive search strategy for Universum samples. Furthermore, we extend it to multi-view high-dimensional data and design multi-view dimensionality reduction methods based on Universum learning, in order to expand more general Universum learning. We will carry out the works including modeling, algorithm design and implementation, theoretical analysis and experimental comparison.

高维数据广泛存在于众多领域，对其进行降维是模式识别的核心之一。现有降维方法通常仅利用目标类样本作为训练样本，忽视了现实中大量存在的目标类以外的数据,即Universum。研究者最近提出的Universum学习方法正是利用目标外样本数据提高了分类和聚类学习效果，但至今尚未有人结合降维开展研究工作。本项目旨在通过与现有降维方法的结合，设计一个利用目标外样本数据的一般性降维框架，设计监督和半监督降维算法，探究目标外样本数据对降维的影响和自适应选择目标外样本数据的策略。进一步，将其扩展到高维多视图数据的降维，设计基于Universum学习的多视图数据降维算法，进而拓展出更广义的Universum学习。整个工作围绕建模、算法设计与实现、理论分析和实验对比等系统展开。

项目摘要

典型相关分析(Canonical correlation analysis，CCA) 是一种经典的多元统计分析方法，可通过最大化不同视图间的相关性同时实现高维多视图数据的降维。CCA的目标函数仅仅关注样本的相关性，因此具有一定的局限性。目前已有很多研究者利用不同的方式将样本的类信息融入降维过程，从而设计出各种监督型或者半监督型降维方法。所有这些方法都是基于目标类样本，也就是说即使我们不知道每个样本具体属于哪一类，但是每个训练样本总是属于其中某一类。实际上，我们获得的训练样本可能还包含与目标类同域而不同类的样本，这些样本称之为Universum数据. 最近有很多研究者利用Universum数据改进分类、聚类和降维算法，显著提高了原有算法的性能，这些方法统称为Universum学习。受此启发，我们将Universum学习与相关分析相结合，分别改进CCA和DCCA，设计了两种针对多视图数据的降维算法UCCA和UDCCA。这两种算法均要求目标类数据的两组变量的投影相关性最大，Universum数据的两组变量的投影相关性最小。不同之处是后者进一步要求目标类数据的同类样本的相关性最大，不同类样本的相关性最小。分析UDCCA的结果发现虽然UDCCA利用的信息量最大，样本间的可分离性并不是最大。我们进一步改进其目标函数，要求同一个视图内的目标类样本与Universum数据的相关性也要最小，从而体现两种训练样本的区别，从而使得提取的新特征具有更强的区分性。我们将这种算法称其为增强型UDCCA（Enhanced　Universum Canonical Correlation Analysis）。对于这三种算法，分别在人工数据集、UCI数据集、USPS数据集、MFD数据集和ORL数据集进行实验对比，其结果也显示了算法的优越性。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

陈晓红的其他基金

批准号：41101548

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：31500439

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：81141031

批准年份：2011

资助金额：10.00

项目类别：专项基金项目

批准号：81272995

批准年份：2012

资助金额：16.00

项目类别：面上项目

批准号：81472912

批准年份：2014

资助金额：75.00

项目类别：面上项目

批准号：90818014

批准年份：2008

资助金额：50.00

项目类别：重大研究计划

批准号：70631004

批准年份：2006

资助金额：85.00

项目类别：重点项目

批准号：51272016

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：50872006

批准年份：2008

资助金额：34.00

项目类别：面上项目

批准号：81072685

批准年份：2010

资助金额：34.00

项目类别：面上项目

批准号：U1736102

批准年份：2017

资助金额：68.00

项目类别：联合基金项目

批准号：30940082

批准年份：2009

资助金额：10.00

项目类别：专项基金项目

批准号：61275038

批准年份：2012

资助金额：75.00

项目类别：面上项目

批准号：30500177

批准年份：2005

资助金额：8.00

项目类别：青年科学基金项目

批准号：61605132

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：39270792

批准年份：1992

资助金额：3.50

项目类别：面上项目

批准号：30870849

批准年份：2008

资助金额：8.00

项目类别：面上项目

批准号：81071068

批准年份：2010

资助金额：32.00

项目类别：面上项目

批准号：71431006

批准年份：2014

资助金额：260.00

项目类别：重点项目

批准号：81470123

批准年份：2014

资助金额：30.00

项目类别：面上项目

批准号：51572014

批准年份：2015

资助金额：64.00

项目类别：面上项目

批准号：91846301

批准年份：2018

资助金额：700.00

项目类别：重大研究计划

批准号：79670100

批准年份：1996

资助金额：7.00

项目类别：面上项目

相似国自然基金

基于充分降维方法的分层变量选择

批准号：11026049

批准年份：2010

负责人：赵俊龙

学科分类：A0403

资助金额：3.00

项目类别：数学天元基金项目

面向复杂数据基于流形学习的非线性降维算法研究

批准号：61305069

批准年份：2013

负责人：陈静

学科分类：F0603

资助金额：20.00

项目类别：青年科学基金项目

超高维数据中基于累积差异的稳健降维方法研究

批准号：11801501

批准年份：2018

负责人：周亭攸

学科分类：A0403

资助金额：20.00

项目类别：青年科学基金项目

高维数据保真降维方法研究

批准号：61471182

批准年份：2014

负责人：祁云嵩

学科分类：F0113

资助金额：75.00

项目类别：面上项目

基于Universum学习的降维方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

陈晓红的其他基金

基于脆弱性视角的城市化与生态环境协调发展研究——以黑龙江省东部煤电化基地为例

胆碱类离子液体对玉米的毒性研究

分化型甲状腺癌相关蛋白异常糖基化与血清学早期诊断

呼吸链电子漏在电离辐射诱导肺成纤维细胞分化中的促进作用及OMT的抑制效应研究

呼吸链复合体Ⅲ电子漏在电离辐射诱导肺成纤维细胞分化中的作用及其发生机制研究

基于元需求模型的可信软件需求获取和分析方法及工具研究

面向复杂大群体的群决策与支持平台

有序介孔炭的形态控制及其电容脱盐性能

有序介孔炭/聚苯胺高性能超级电容器电极材料的优化设计

氧化苦参碱下调HSP27抑制纤维化肺成纤维细胞迁移的机制研究

新型喷墨打印篡改文件的识别和可视化关键技术研究

无血清培养筛选分化型甲状腺癌血清标志物及临床验证

超薄活性层有机太阳能电池研究

快速发现大鼠脑缺血预适应新相关蛋白质及其功能的研究

基于数字全息显微（DHM）技术重建签名三维动态特征的个体识别新方法

硝喹对疟原虫红外期线粒体呼吸功能的影响

大鼠脑缺血预适应新相关蛋白质及其功能的研究

整合素ɑⅤβ3 在脑缺血预适应中的动态变化及意义研究

面向环境管理的嵌入式服务决策支持理论与平台

SDHD截短突变R38X家族性副神经节瘤表型的影响因素及作用机制研究

石墨烯/环氧交联氨基改性氧化硅复合气凝胶的制备与结构性能

大数据驱动的公共管理决策创新模式与集成示范平台

基于通用系统理论的决策支持系统的研究

相似国自然基金