Currently, GPU acceleration of PIC(Particle-in-cell) simulation in Plasma Physics only focuses on explicit PIC model. Besides, using GPU acceleration only is not suitable for large-scale data simulation. This research will study the simulation of implicit PIC model. Furthermore, framework, data structures and algorithms related to CUDA+OpenMP+MPI comprehensive parallelization will be designed. Various implementations will be benchmarked and compared, too. The problems on particle sequencing, memory conflicts and load balancing will be solved. In this way, this research can make full utilization of the advantages of CUDA on parallel computation, thread cooperation, fast rendering and streaming. An applicable and GPU accelerated 3D PIC program can be implemented based on them. Pratical problems of plasma physics, especially the full-size 3D simuations of plasma chamber in Microelectronics industry, will also be performed.
目前等离子物理中的粒子模型模拟的GPU加速只针对显格式粒子模型,并且单纯使用GPU加速无法适应大规模数据的模拟。本项目研究隐式粒子模型模拟的GPU加速方案,并进一步设计CUDA+OpenMP+MPI混合并行相应的结构框架、数据结构和程序算法,并对不同的实现进行系统的性能评价和比较,解决粒子排序、内存冲突和负载均衡等问题,充分发挥CUDA在并行计算,线程协作,快速渲染和流水作业方面的优势,在此基础上完成实用的、经过GPU加速的三维粒子模型程序,并对实际物理问题进行研究,特别是将对微电子工业中的等离子体腔室进行3D全尺寸模拟。
随着高性能计算的不断发展,基于图形处理器、协处理器等运算单元等进行并行优化以加快运算速度成为当前科学计算领域的重要研究方向。而目前等离子物理中的粒子模型模拟的GPU加速只针对显格式粒子模型,并且单纯使用GPU加速无法适应大规模数据的模拟。本研究的内容主要针对等离子体物理中PIC模型的GPU加速问题,特别针对隐式PIC模型和CUDA+OpenMP+MPI混合加速,设计相应的程序算法、数据结构,并对不同程序算法和结构进行系统的性能评价和比较,在此基础上编制完成实用的、经过GPU加速的三维PIC程序,并针对实际物理问题的模拟程序设计框架,从而辅助等离子物理学研究。.本项目的成果主要体现在:(1)物理模型的建立与基于Xeon Phi的初步并行优化程序开发:通过结合Phi的硬件特点,采用新的数据结构,并利用SIMD和OpenMP对程序进行优化和并行化,PIC程序能够高效的运行于Phi卡上。通过进一步优化,PIC程序能够在Phi上获得更好的加速比,并显著提高PIC和MC程序的计算能力。.(2)MIC/CPU混合架构的全隐式粒子模拟程序的I/O 性能优化:在MIC/CPU混合架构的集群上,全隐式粒子模拟程序需要采用单个文件、并行读写的方式才能获得较好的I/O性能,但这种方法在纯CPU架构的集群上性能不佳。实验表明可以通过修改stripe count和length获得较好的性能。.(3)基于GPU并行优化的粒子模拟程序:基于GPU的并行优化的粒子模拟算法在运行速度上获得了将近1倍的提升,从而证实了并行计算的优越性所在,以及高度的可行性,从而也间接地证实了支持CUDA的GPU的广泛的引用前景。.(4)基于GPU并行优化的机器学习方法:本研究基于片对齐框架的图论机器学习方法提出了一种多特征融合的降维方法。首先,该方法利用超图描述数据之间的关联性,并且通过局部优化阶段将不同特征下构造的片进行结合,从而获得拉普拉斯矩阵。其次,利用GPU加速优化了欧氏距离和矩阵乘法的计算,使得数据量增大之时运算时间仍然处于很短的范围内。在PASCAL VOC2007上的实验表明,本方法比现有方法可获得最高达100倍以上的加速。.综上所述,该项目的成果解决了隐式PIC的加速问题,推进了异质系统架构在科学计算领域应用,从而直接促进了高性能计算及其相关应用的研究。
{{i.achievement_title}}
数据更新时间:2023-05-31
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
基于SSVEP 直接脑控机器人方向和速度研究
MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs
钢筋混凝土带翼缘剪力墙破坏机理研究
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
基于混合网格的隐式/并行高阶DG/FV混合算法研究
PET图像重建:GPU加速的H无穷粒子滤波混合算法
基于大涡模拟的移动粒子半隐式法研究及其应用
CUDA加速的地图代数空间分析并行机制研究