基于图的半监督学习算法研究

基本信息
批准号:11526087
项目类别:数学天元基金项目
资助金额:3.00
负责人:左玲
学科分类:
依托单位:湖北工业大学
批准年份:2015
结题年份:2016
起止时间:2016-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:
关键词:
半监督学习稳定性图正则化收敛性稀疏性
结项摘要

Nowadays, the semi-supervised learning has become a hot topic in the area of machine learning, pattern recognition and signal processing. The graph-based semi-supervised algorithm is an important method in semi-supervised learning. Recent research has revealed several drawbacks of these algorithms such as the high computation cost in the optimization procedure and the sensitivity in dealing with problems involving heavy tailed non-Gaussian noise. If these problems are not solved properly, they will decrease the effectiveness of the graph-based methods, which could even destroy the benefits of semi-supervised learning. In this project, we will first try to establish proper assumption models. Under these models, the sparse graph-based regularization algorithms will be proposed, which can effectively reduce the computational complexity. Then the entropy in information theory will be applied to the learning of graph-based regularization algorithms. We will employ entropy to substitute the traditional square loss function in graph-based regularization methods, and construct novel algorithms which can effectively deal with the non-Gaussian distribution noise. Next, in the framework of statistical learning theory, we provide a comprehensive analysis on the sparsity, stability and convergence for the proposed formulations under the operator assumptions. Finally, the efficiency of the proposed methods will be verified by experiments on both artificial data sets and real data sets. The aim of the research project is to improve the sparsity, stability and convergence of graph based regularization algorithms. Also, we wish to promote the basic theoretical achievements to the level of application. We believe that the expected results of the project could provide effective graph based regularization algorithms, and enrich the development of the theory and application for graph-based semi-supervised learning.

半监督学习是近年来机器学习、模式识别及信号处理等领域的热点问题。而基于图正则化的半监督算法是半监督学习中的一类重要方法。近来的研究揭示了此类算法计算量庞大及对非高斯噪声敏感等不足。如不妥善解决,将使算法的学习效率大打折扣,阻碍半监督学习优势的发挥。本项目首先针对基于图正则化的半监督算法计算量大的弊端建立合理的模型假设,提出稀疏的基于图的半监督算法。然后,将信息论中熵的概念引入到基于图的半监督学习中。利用熵替代传统图正则化算法中的平方损失,提出能够有效处理非高斯分布噪声的算法,接下来从统计学习理论的角度出发,利用算子逼近技术,全面地分析图正则化算法的稀疏性、对非高斯分布噪声的稳定性及收敛性。并且,将算法应用于模式识别、信号处理等实际问题。项目以提高算法的稀疏性、稳定性及收敛性为目标,并将部分基础理论成果推广至应用技术层面,促进图正则化的半监督学习理论和应用的进一步深化和发展。

项目摘要

半监督学习是近年来机器学习、模式识别等领域的热点问题。基于图的半监督算法是半监督学习中的一类重要方法。传统的基于图的半监督算法具有计算量庞大、对非高斯噪声敏感与匮乏理论分析等弊端。其严重阻碍了半监督算法学习性能的提高。针对这些不足,本项目考虑设计新的基于图的半监督学习算法,提高算法的稀疏性、对非高斯分布噪声的稳定性与收敛性。.首先,针对图正则化半监督算法计算量庞大的弊端,考虑设计稀疏的图正则化半监督算法。目前大量的基于图的半监督算法模型利用图正则化因子挖掘海量未标记训练样本的数据结构,以此提高算法的推广性能。本项目考虑在传统的基于图的半监督算法框架中引入L1-正则化因子,构造新的图正则化半监督算法。通过L1-正则化因子使构造的半监督算法对训练样本进行选择,进而提高算法的稀疏性。.其次,考虑将信息理论中的相关熵函数与传统的基于图的半监督算法相结合,设计对非高斯分布噪声稳定的图正则化半监督算法。目前大量的基于图的半监督算法采用平方损失函数构造正则化体系。由于平方损失对高斯分布的依赖性,此类算法在处理非高斯分布的噪声问题时表现并不好。针对这一不足,本项目分三个方面来构造基于相关熵的图正则化半监督算法。首先采用信息理论中的相关熵函数构造图正则化的半监督算法模型。利用相关熵函数对非高斯分布噪声不敏感的特性,设计出对非高斯分布噪声稳定的图正则化半监督算法。接下来,利用统计学习理论中的误差分析技术对所设计算法进行理论分析,证明算法的稳定性。并且,建立算法的学习速率,证明算法的收敛性。.最后,通过实验验证所设计的图正则化半监督学习算法具有较好的稀疏性、能够有效处理非高斯分布的噪声问题。并且,将此类应用于模式识别及图像处理等实际问题。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于国产化替代环境下高校计算机教学的研究

基于国产化替代环境下高校计算机教学的研究

DOI:
发表时间:
2

珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征

珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征

DOI:10.7524 /j.issn.0254-6108.2017122903
发表时间:2018
3

向日葵种质资源苗期抗旱性鉴定及抗旱指标筛选

向日葵种质资源苗期抗旱性鉴定及抗旱指标筛选

DOI:10.7606/j.issn.1000-7601.2021.04.29
发表时间:2021
4

复杂系统科学研究进展

复杂系统科学研究进展

DOI:10.12202/j.0476-0301.2022178
发表时间:2022
5

基于综合治理和水文模型的广西县域石漠化小流域区划研究

基于综合治理和水文模型的广西县域石漠化小流域区划研究

DOI:10.14050/j.cnki.1672-9250.2017.02.014
发表时间:2017

左玲的其他基金

批准号:61702167
批准年份:2017
资助金额:26.00
项目类别:青年科学基金项目

相似国自然基金

1

基于图的半监督学习最优化模型及算法研究

批准号:11326189
批准年份:2013
负责人:吕佳
学科分类:A0405
资助金额:3.00
项目类别:数学天元基金项目
2

基于图的半监督学习的快速鲁棒算法研究及其应用

批准号:61572315
批准年份:2015
负责人:杨杰
学科分类:F0605
资助金额:66.00
项目类别:面上项目
3

基于自适应图与维数约简的半监督学习研究

批准号:61602221
批准年份:2016
负责人:易玉根
学科分类:F0210
资助金额:20.00
项目类别:青年科学基金项目
4

半监督排序学习理论与算法研究

批准号:61003045
批准年份:2010
负责人:潘炎
学科分类:F0202
资助金额:20.00
项目类别:青年科学基金项目