面向多领域数据的联合流形学习方法及在迁移学习中的应用

基本信息
批准号:61370006
项目类别:面上项目
资助金额:58.00
负责人:王靖
学科分类:
依托单位:华侨大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:陈锻生,李丽敏,崔振,陈柏生,柯良文,陈鹏飞,陈明霞,张昕
关键词:
缺失值流形学习多领域迁移学习
结项摘要

Mining the latent features of multi-domain data is a widely-focused problem in the field of data mining in recent years. As an effective method to discover the latent features of high-dimensional data, manifold learning has much difficulty in its application to multi-domain data mining. To solve these problems, the project will research on the joint manifold learning method on multi-domain data. Firstly, the collaborative filling algorithms, feature transfer methods and manifold smoothing methods will be introduced to the preprocessing of manifold data to improve the stability of manifold topological structure. Then, the relative theories and methods in numerical algebra will be introduced, and new models and algorithms will be proposed to discover the inner structure of the manifold and the relations between data from diverse domains. Lastly, new eigenvalue algorithm will be introduced to solve the global optimization model of joint manifold learning which can improve the ability of handling large scale data. What's more, the project will conduct research on the application of joint manifold learning, which can improve the technologies of knowledge transfer with multiple cross sources. The successful implementation of the project will make positive impact on the development of manifold learning theories and methods, and provide useful supplement for current transfer learning methods. What's more, the case study can also widen the application of manifold learning on the fields such as the cross-lingual text classification and genome-wide association study.

如何挖掘多领域数据的潜在特征,是近年来数据挖掘领域中备受关注的一个问题。流形学习作为挖掘高维数据潜在特征的有效方法,将其应用于多领域数据挖掘却存在着许多困难。针对这些困难,本项目拟开展面向多领域数据的联合流形学习方法研究。首先,结合协同过滤技术、特征迁移、流形光滑化等方法,对流形数据预处理,增加流形拓扑结构稳定性;其次,引入数值代数中的相关理论和方法,提出新模型和算法挖掘同领域数据的内部结构和跨领域数据的关联性;最后,引入新的特征值求解算法,求解联合流形学习的全局优化模型,提高处理大规模数据的能力。此外,本项目还将开展联合流形学习方法的应用研究,将其应用于迁移学习,改进多源跨领域知识迁移的技术。本项目的成功实施,将对流形学习的理论和方法产生积极的影响,也是对现有迁移学习方法的有益补充。此外,实例研究的开展,也能促进流形学习在跨语言文本分类、全基因组关联性分析等领域的广泛应用。

项目摘要

流形学习作为挖掘高维数据潜在特征的有效方法,难以直接用于挖掘多领域数据的共同潜在特征。本项目从流形数据预处理、面向多领域数据的流形对齐、以及应用角度开展研究。在数据预处理方面,我们针对噪声数据提出了挖掘真正局部几何结构的方法,有效的减少噪声数据的影响;针对缺损数据,我们提出了基于特征子空间迁移的协同过滤算法,利用辅助领域特征帮忙对目标领域的缺损数据进行填充。此外,我们还提出了面向缺损数据的流形学习方法,对传统的LE,LTSA方法进行改进,能有效挖掘缺损数据的低维特征。面向多领域数据,我们提出了基于少量对应点的半监督流形对齐算法,充分利用少量对应点信息挖掘不同流形对应点的关联性,并从理论上验证了所提算法的有效性;提出了基于全局和局部特征匹配的流形对齐算法,能有效挖掘多领域数据的共同潜在特征。从应用方面,我们提出了基于稀疏重构权的错误标注数据检测算法,有效检测错误标注数据,从而提高数据分类的准确率;将度量学习引入流形学习,在新的距离度量方式下构造样本点的局部邻域以及挖掘局部几何结构,推进流形学习在数据分类中的应用。此外,通过在大量实际例子中的实验,改进了流形学习在文本分类、人脸姿态估计、视频对齐等领域的应用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

王靖的其他基金

批准号:31271011
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:11774065
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:81800844
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:10901062
批准年份:2009
资助金额:17.00
项目类别:青年科学基金项目
批准号:81202711
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:50973029
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:31870953
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:31470923
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:41101046
批准年份:2011
资助金额:26.00
项目类别:青年科学基金项目
批准号:81872160
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:81372829
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:51802123
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目

相似国自然基金

1

面向多标签数据的自步流形学习方法研究

批准号:61806159
批准年份:2018
负责人:杨博
学科分类:F0605
资助金额:26.00
项目类别:青年科学基金项目
2

面向跨领域异构数据的患者相似性学习方法及应用

批准号:81671786
批准年份:2016
负责人:陈卉
学科分类:H2806
资助金额:25.00
项目类别:面上项目
3

面向大数据的安全迁移学习方法

批准号:61502265
批准年份:2015
负责人:龙明盛
学科分类:F0605
资助金额:22.00
项目类别:青年科学基金项目
4

面向复杂数据的稀疏流形学习方法研究

批准号:61272333
批准年份:2012
负责人:雷迎科
学科分类:F0214
资助金额:79.00
项目类别:面上项目