大规模非负矩阵分解的可扩展并行算法研究

基本信息
批准号:61602169
项目类别:青年科学基金项目
资助金额:20.00
负责人:唐兵
学科分类:
依托单位:湖南科技大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:Gilles Fedak,刘道建,石林,张黎,杜拼,雷文全,徐滨
关键词:
非负矩阵分解内存计算可扩展计算GPU计算
结项摘要

Non-negative Matrix Factorization (NMF) is a basic mathematical method for machine learning and data mining, which has been successfully used in many fields. However, due to the high computation complexity of NMF, the parallelization of NMF has attracted a wide spread attention in recent years. Designing the high scalable parallel NMF algorithm is an important research topic. In the proposal, we intend to study the combination of in-memory computing technique and graphics processing unit (GPU) acceleration technique based fast parallel NMF algorithm, as well as the parallel NMF algorithm with sparseness constraints. Large memory and GPU resource of computing node in a heterogeneous cluster environment are fully utilized to realize high efficient NMF computation. The factors which may affect algorithm scalability are analyzed, and a variety of optimization methods are conducted to improve the performance of parallel NMF. The proposed algorithm will be compared with current OpenMP, MPI, GPU and MapReduce based parallel NMF algorithms. Through this study, we will eventually obtain a high scalable parallel NMF algorithm, which can be automatically scaled to support processing ultra-large high-dimensional NMF. Finally, the proposed parallel NMF algorithm will be applied in a real scenario of commodity recommendation to perform the scalability verification and evaluation. This study will further expand the application fields of NMF, and provides an important method for feature extraction, recommender systems, information retrieval and etc.

非负矩阵分解(NMF)是机器学习和数据挖掘中的一种基本数学方法,已被成功应用于多个领域,但由于其计算复杂度较高,近年来其并行化求解受到了广泛的关注。设计高可扩展的并行化NMF算法是目前重要的研究课题。本项目拟研究基于内存计算技术和基于图形处理器(GPU)加速技术相结合的快速NMF可扩展并行算法,并研究加稀疏性约束的NMF并行算法,充分利用异构集群中节点的大内存和GPU资源实现高效的求解。分析影响并行算法可扩展性的因素,结合多种优化手段,提高算法性能,并将其与目前的基于OpenMP、MPI、GPU和MapReduce的并行NMF算法进行比较。将最终获得高度可扩展的并行化的NMF算法,算法能够自动扩展至支持处理超大规模高维非负矩阵的分解。最后,在真实的商品推荐应用场景中进行非负矩阵分解算法的验证及性能测试。该研究将进一步拓展非负矩阵分解的应用体系,为特征提取、推荐系统、信息检索等提供重要手段。

项目摘要

非负矩阵分解(NMF)是机器学习和数据挖掘中的一种基本数学方法,已被成功应用于多个领域,但由于其计算复杂度较高,近年来其并行化求解受到了广泛的关注。设计高可扩展的并行化NMF算法是目前重要的研究课题。本项目研究了基于内存计算技术和基于图形处理器(GPU)加速技术相结合的快速NMF可扩展并行算法,充分利用异构集群中节点的大内存和GPU资源实现高效的求解。在项目执行期间,共发表了11篇相关论文,实现了基于MPI+OpenMP的并行非负矩阵分解算法,实现了基于GPU的并行非负矩阵分解算法,提出了一种Spark和GPU融合的框架,并实现了基于GPU+Spark的并行非负矩阵分解算法。利用GPU和Spark的各自优势,该算法能够自动扩展至支持处理超大规模高维非负矩阵的分解,并在协同过滤推荐的场景下,进行了算法性能测试,取得了较好效果。该研究将进一步拓展非负矩阵分解的应用体系,加速非负矩阵分解的速度,为特征提取、推荐系统、信息检索等提供重要手段。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
2

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
3

MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs

MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs

DOI:
发表时间:2018
4

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
5

感应不均匀介质的琼斯矩阵

感应不均匀介质的琼斯矩阵

DOI:10.11918/j.issn.0367-6234.201804052
发表时间:2019

唐兵的其他基金

批准号:30370018
批准年份:2003
资助金额:20.00
项目类别:面上项目
批准号:31770072
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:30870052
批准年份:2008
资助金额:34.00
项目类别:面上项目
批准号:81900325
批准年份:2019
资助金额:20.00
项目类别:青年科学基金项目
批准号:31470185
批准年份:2014
资助金额:85.00
项目类别:面上项目
批准号:31270099
批准年份:2012
资助金额:85.00
项目类别:面上项目
批准号:30970053
批准年份:2009
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

大规模非负矩阵分解的优化模型和并行算法研究及应用

批准号:11101420
批准年份:2011
负责人:韩丛英
学科分类:A0405
资助金额:22.00
项目类别:青年科学基金项目
2

非负矩阵集分解研究

批准号:60872084
批准年份:2008
负责人:章毓晋
学科分类:F0116
资助金额:30.00
项目类别:面上项目
3

基于非结构网格的复杂流动大涡模拟高可扩展区域分解并行算法

批准号:11602282
批准年份:2016
负责人:廖子菊
学科分类:A0910
资助金额:25.00
项目类别:青年科学基金项目
4

大规模非负矩阵分解算法及其在盐湖保护与利用方面的应用研究

批准号:11241005
批准年份:2012
负责人:胡运红
学科分类:A0505
资助金额:40.00
项目类别:专项基金项目