关于大数据处理分布式学习算法的可行性理论研究

基本信息
批准号:11401462
项目类别:青年科学基金项目
资助金额:22.00
负责人:常象宇
学科分类:
依托单位:西安交通大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:林绍波,徐麟,张煦国
关键词:
大数据处理学习理论高维数据分析统计机器学习
结项摘要

Classical statistical machine learning algorithms encounter two fundamental challenges in the big data age, namely how to design machine learning algorithms that can be applied to big data process and how to provide a theoretical analysis framework for the algorithms. For the first question, there have been huge literatures to generalize the classical algorithms to their distributed versions based on the divide-and-conquer strategy. However, it only has less theoretical analysis to support the feasibility of distributed learning algorithms..Therefore, we focus on two basic problems of applying machine learning algorithm to big data process in this project. One is developing a theoretical analysis framework to study the feasibility of the distributed learning algorithms. Another is generalizing some machine learning algorithms to their distributed versions (e.g. community detection algorithm base on stochastic blokmodels).

进入大数据时代,经典的统计机器学习算法面临着两个基本的挑战,即如何设计能够适应于大数据的统计机器学习算法,以及如何分析这样算法的可行性。针对第一个问题,有大量的文献研究了如何利用分而治之的策略把经典的统计机器学习算法推广为分布式学习算法。但是这样的分布式学习算法对于大数据处理是否是可行的仍然没有完整的理论研究。.因此,本项目将聚焦于研究统计机器学习方法应用于大数据的两个基本问题:第一,从理论上对于分布式学习算法研究其可行性,特别的对于分布式回归算法,分布式K均值聚类算法,分布式随机块算法提供可行性理论;第二,针对一些特定的还不能应用于大数据的非分布式学习算法(例如基于随机块模型的社区发现算法)设计分布式学习算法。

项目摘要

扣紧研究计划,项目组对大数据的分布式学习算法的可行性理论做了深入的研究。在理论方面,本项目的主要研究成果包括: 基于新的误差分解策略的分布式回归算法的学习理论。针对高维数据的稀疏聚类方法的可行性理论。针对大规模社交网络的统计建模与分析。基于上述三部分成果,本项目组共发表论文20篇,其中19篇文章被SCI收录,1篇会议文章被EI收录。特别的,其中一篇文章被统计机器学习的顶级期刊Journal of Machine Learning Research收录。本项目所构建的理论分析方法已经被其他文章所使用,并引用超过10余次。在人才培养方面,培养毕业博士2名,副教授1名,陕西省高等学校杰出青年人才1名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
4

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
5

"多对多"模式下GEO卫星在轨加注任务规划

"多对多"模式下GEO卫星在轨加注任务规划

DOI:10.19328/j.cnki.2096-8655.2022.02.002
发表时间:2022

常象宇的其他基金

批准号:11771012
批准年份:2017
资助金额:48.00
项目类别:面上项目

相似国自然基金

1

大数据机器学习分布式算法的可行性理论

批准号:61573326
批准年份:2015
负责人:张永全
学科分类:F0603
资助金额:64.00
项目类别:面上项目
2

关于流形学习的有效性算法与特征提取解释理论研究

批准号:60905003
批准年份:2009
负责人:孟德宇
学科分类:F0304
资助金额:18.00
项目类别:青年科学基金项目
3

面向海量数据处理的多核学习算法及其并行优化方法研究

批准号:61005045
批准年份:2010
负责人:胡明清
学科分类:F0603
资助金额:20.00
项目类别:青年科学基金项目
4

基于事件驱动的稀疏分布式学习算法研究

批准号:61703117
批准年份:2017
负责人:艾武
学科分类:F0603
资助金额:28.00
项目类别:青年科学基金项目