并行与分布式稀疏正则化学习

基本信息

批准号：11871474

项目类别：面上项目

资助金额：52.00

负责人：焦雨领

学科分类：

依托单位：中南财经政法大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：魏天闻,曹勇秀,余吉昌,魏倩,杨菁蓓,金宇升,陈媛,刘宇青,宋慧茹

关键词：

统计学习分布式稀疏正则化估计误差并行

结项摘要

Bounding the estimation errors and developing fast numerical algorithms are two main tasks of sparse statistical learning. Due to the huge number of the sample and the dimensionality of features, designing and analyzing of parallel algorithm which is can be implemented at multi-core platform, and developing estimation theory and algorithms that ate suitable for distributed stored data become hot topics in statistical learning based on sparse regularization. The main effort of this proposal aimed at addressing the following two issues. The first major research of this project is to propose a parallel framework for multi - core platforms with shared memory to solve common sparse regularization learning models. We study the numerical convergence of the parallel algorithm (the convergence of the generated sequence to the optimal solution set) and the statistical property of the output the algorithm (the estimation error between the generated sequence and the true solution established with high probability). The second research contents of this project is proposing a distributed PDAS method when the data are distributed storage. We will bound the number of rounds of communications of distributed PDAS and prove the high probability estimation error and qualifying the uncertainty of the output solution.

研究稀疏正则化模型的估计误差和发展相应数值算法是稀疏统计学习的两个主要任务。由于数据的样本量和特征的维数都很大, 设计和分析适合共享内存的多核计算平台的并行算法以及发展适合数据分布式存储在多机情景下的估计理论和算法成为了基于稀疏正则化的统计学习的研究热点。本项目的第一个主要研究内容是提出一个适用于共享内存的多核平台的并行框架求解常见稀疏正则化学习模型。结合连续化研究所提并行算法的数值收敛性（迭代点列到模型最优解集的收敛性分析其并行效率）和算法输出解的统计性质（以高概率成立的迭代点列和真解之间的估计误差）。本项目的第二研究内容是提出在数据分布式存储情景下的分布式PDAS方法并分析分布式PDAS 的通讯次数、证明输出解和真解之间以高概率成立的估计误差、并基于分布式PDAS输出解对真解构建置信区间进行不确定性量化。

项目摘要

稀疏学习的模型与算法是近10年统计、应用数学、计算机、工程应用等众多领域地交叉点。相关的模型、算法对国防、医疗、生产生活产生了巨大的影响。研究稀疏学习中有理论保证的高效算法, 给众多的应用场景提供理论基石有着重要的意义。按照项目的规划我们设计求解稀疏学习模型的高效算法并分析了其统计性质，弥补了统计和计算之间的间隙。具体如下：. 统计COPSS总统奖获得者、ICM45钟报告人、加州大学伯克利分校的M. Wainwright 教授在2014年发表在Annual Review of Statistics and Its Applications 的综述性论文中指出“填补高维统计和计算之间的间隙是一个公开问题”。候选人和合作者设计了求解高维稀疏模型PDAS算法和其分布式版本, 并证明了算法输出结果与真解的统计误差, 解决了此公开问题, 相关论文发表在Journal of Mechine Learning Research 、Statistical Science、SIAM Jouranl on Scientific Computing、IEEE Transaction on Signal Processing, Neurocomputing 等杂志。相关工作收到 AMS和ISA Fellow、滴滴出行首席统计学家Zhu Hongtu 教授等国内外同行的关注应用和推广。PDAS算法得到了工业界的广泛关注被集成到华为自主研发的的机器学习库中。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.14050/j.cnki.1672-9250.2017.02.014

发表时间：2017

DOI：

发表时间：2019

DOI：10.7498/aps.70.20202116

发表时间：2021

DOI：10.12011/setp2020-2080

发表时间：2022

焦雨领的其他基金

批准号：11501579

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

相似国自然基金

基于稀疏正则化和深度学习的湍流退化图像复原研究

批准号：61402480

批准年份：2014

负责人：谢源

学科分类：F0210

资助金额：27.00

项目类别：青年科学基金项目

稀疏正则化方法研究

批准号：11171272

批准年份：2011

负责人：张海

学科分类：A0602

资助金额：40.00

项目类别：面上项目

结合时空统计学习的视频超分辨自适应稀疏正则化理论与算法

批准号：61171165

批准年份：2011

负责人：肖亮

学科分类：F0116

资助金额：60.00

项目类别：面上项目

自适应字典学习和非局部正则化的图像稀疏恢复建模与算法研究

批准号：61362021

批准年份：2013

负责人：陈利霞

学科分类：F0116

资助金额：43.00

项目类别：地区科学基金项目

并行与分布式稀疏正则化学习

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于综合治理和水文模型的广西县域石漠化小流域区划研究

基于旋量理论的数控机床几何误差分离与补偿方法研究

非牛顿流体剪切稀化特性的分子动力学模拟

中国出口经济收益及出口外资渗透率分析--基于国民收入视角

焦雨领的其他基金

非凸稀疏正则化模型与算法的研究

相似国自然基金