基于马氏抽样的机器学习理论与算法研究

基本信息
批准号:61370002
项目类别:面上项目
资助金额:62.00
负责人:邹斌
学科分类:
依托单位:湖北大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:周双娥,万成高,徐婕,陈晨,左玲,刘媛,高莹莹,李传洲,张正
关键词:
马氏抽样学习理论算法稳定机器学习泛化性能
结项摘要

With the rapid development of computer technology, the ability of collecting data and storing data has been improved dramatically. Both the science research and other fields of public life have accumulated a large number of data. Analyzing these data and exploring the useful information from these data have been the joint demand and the challenge. In order to better find the useful information from the data set, we introduce the method and ideal of Markov sampling from the data set based on many years' study on the theory and algorithm of machine learning with non-i.i.d. samples. The goal of this project is to establish the framwork of machine learning theory for Markov sampling by studying the consistency, convergence rate and generalization ability of machine learning algorithms based on Markov sampling. We will establish the Markov sampling method that has better learning properties such as better generalization ability, better stable property and better sparse property for different learning problems, and then apply these research's results to the application domains of data mining. Our aim is to present some new techniques and some new methods of data analysis for the data mining of massive data.

随着计算机技术的飞速发展,人们收集数据、存储数据的能力得到了极大的提高。无论是科学研究, 还是社会生活的各个领域中都积累了大量的数据, 对这些数据进行分析以发掘出数据中蕴含的有用信息,几乎成为所有领域的共同需求和要面临的挑战。在多年来对非独立同分布数据下机器学习理论和算法研究的基础上,我们提出了对数据进行马氏抽样以便更好发掘数据中有用信息的思想和方法。本项目旨在通过研究马氏抽样下机器学习算法的一致性、收敛速率和泛化性能,建立马氏抽样下机器学习的理论框架,进而对不同学习问题建立具有比较好的泛化性、稳定性和稀疏性等学习性能的马氏抽样方法,并将研究成果应用到数据挖掘的实际问题中,为数据挖掘,特别是海量数据挖掘提供数据分析的新技术和新方法。

项目摘要

在本项目中,我们对基于马氏抽样的机器学习理论和算法进行了全面系统的研究,在理论分析和算法设计两个方面都取得了比较好的研究成果,主要研究内容包括:对基于马氏抽样的经典机器学习算法(如支持向量机分类,最小二乘正则化回归,支持向量机回归,LASSO, 在线支持向量机分类)的一致性、收敛速率和泛化性能进行了全面的研究:从理论上分析了基于马氏抽样的上述算法的泛化性能,证明了基于马氏抽样下上述算法是一致的,建立了基于马氏抽样的上述机器学习算法最优的收敛速率。这些理论研究成果的取得丰富和发展了经典的机器学习理论。在理论研究的基础上,我们又对基于马氏抽样的机器学习算法的设计进行了研究,设计出了基于马氏抽样的支持向量机分类算法,基于马氏抽样的正则化回归算法,基于马氏抽样的在线支持向量机分类算法。还提出了基于多次(k次)马氏抽样的支持向量机分类算法,该算法不仅具有比较好的泛化性能,而且所需的抽样与训练总时间更少,得到的分类器也更稀疏。这些算法为大数据的分析与挖掘提供了新思路和新方法。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
4

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

邹斌的其他基金

批准号:51875319
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:60672091
批准年份:2006
资助金额:25.00
项目类别:面上项目
批准号:10947131
批准年份:2009
资助金额:3.00
项目类别:专项基金项目
批准号:51005136
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:61772011
批准年份:2017
资助金额:53.00
项目类别:面上项目
批准号:61871158
批准年份:2018
资助金额:63.00
项目类别:面上项目
批准号:61070225
批准年份:2010
资助金额:25.00
项目类别:面上项目
批准号:51575322
批准年份:2015
资助金额:68.00
项目类别:面上项目

相似国自然基金

1

大数据环境下基于马氏重抽样的分布式集成学习的理论与算法

批准号:61772011
批准年份:2017
负责人:邹斌
学科分类:F0201
资助金额:53.00
项目类别:面上项目
2

大数据环境下基于选择性抽样的在线学习理论与算法研究

批准号:61403132
批准年份:2014
负责人:徐婕
学科分类:F0603
资助金额:24.00
项目类别:青年科学基金项目
3

基于马氏链蒙特卡罗抽样的近震走时层析成像方法研究

批准号:41874072
批准年份:2018
负责人:张风雪
学科分类:D0404
资助金额:63.00
项目类别:面上项目
4

天气雷达精准降水估计机器学习理论与算法研究

批准号:61906190
批准年份:2019
负责人:杨雪冰
学科分类:F0608
资助金额:24.00
项目类别:青年科学基金项目