以CPU+GPU为代表的大型异构系统目前已经成为超级计算机发展的一个重要方向,其上高性能数值算法有重要研究价值。应用领域中许多问题可以归结为偏微分方程的大规模数值求解,其中预条件子扮演了重要的角色。目前在异构系统上,传统的基于单层区域分裂的预条件子算法难以实现较高的可扩展性,而基于稀疏矩阵的算法则无法获得较高的计算性能。因此,在算法的研究中,必须充分并利用大型异构系统本身所具有的异构、混合、分层等特点。本项目旨在结合具体应用领域中的典型问题,研究适应于以CPU+GPU为代表的大型异构系统一类新型多层区域分裂预条件子算法,用于偏微分方程的大规模数值求解之中。该算法与异构系统的体系结构紧密结合,具有多层嵌套的特点。通过本项目的研究,力争在以天河1A、星云等为代表的国产千万亿次异构系统上实现对CPU和GPU的有效利用,达到数万、甚至数十万核的高可扩展性,做出有显示度的工作。
传统区域分裂算法以单一层次区域划分为主要依据,并且出于理论分析和实际应用的需要,假定每个子区域均为凸的、单联通区域,从而实现负载均衡和通信极小。然而,对于以CPU+GPU、CPU+MIC等为代表的异构系统而言,单一层次的区域分裂既不能充分发挥异构计算单元各自不同的计算能力,也不能有效减少子区域之间的数据移动开销。在本项目执行期间,我们主要从两个角度开展了多层异构区域分裂算法研究。一是针对不同类型的异构计算系统,提出更为适用、更为灵活的多层区域分裂方案,并在天河1A、天河2等顶级计算系统上进行了十万核、以及百万核以上级的大规模实算。二是以新型超级计算机评测基准HPCG为研究对象,将上述多层区域分裂算法首次应用于隐式问题求解之中,并在天河2上取得整机312万核扩展、总性能世界排名第一的成果。我们相信上述研究成果有助于为本重大计划以及相关研究提供有益参考,并衷心希望有机会延续本项目的研究,将研究成果进一步提炼、升华,更好地为国家服务。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
面向云工作流安全的任务调度方法
天津市农民工职业性肌肉骨骼疾患的患病及影响因素分析
大型异构系统上数百万核可扩展的新型区域分裂隐式求解器研究
异构众核平台CFD高效预条件JFNK并行求解算法及应用
稀疏优化算法及预条件子加速技术与图像处理研究
非线性区域分解预条件子研究及其在流固耦合控制中的应用