面向气候和湍流模拟的百万量级异构众核可扩展并行算法与优化方法

基本信息
批准号:61432018
项目类别:重点项目
资助金额:300.00
负责人:张云泉
学科分类:
依托单位:中国科学院计算技术研究所
批准年份:2014
结题年份:2019
起止时间:2015-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:张凤,陈一峯,冯晓兵,张贺,姚二林,张东凌,袁良,崔翔,杨鲲
关键词:
可扩展并行异构众核气候百万量级湍流
结项摘要

With more and more obvious development trend of future hundreds of Petaflops and Exascale supercomputing systems architecture may adopt heterogeneous manycore architecture, more and more parallel application software face with the performance continuous linear scalable and portability challenge. In this project, aims at the above mentioned challenges on performance scalability and portability of two key application fields, i.e. Global Climate and Direct Turbulence simulation applications, we plan to carry out researches on the multi-level non-continuous and non-linear scalability theory and the physical modeling methods with millions of parallelism. Focused on the typical computation pattern and communication pattern of the above two key application fields, including structural and non-structural mesh, FFT, dense and sparse linear algebra, we plan to carry out researches on the interconnection network topology-aware and communication avoiding scalable parallel algorithms, semantic and resource-aware parallel programming framework and self-adaptive performance optimization techniques based on template methods. With the (physical modeling)-(parallel algorithm)-(paralel software)-architecture multi-level co-design and fusion research scheme, we try to realize the demonstrative scalable running on millions of heterogeneous manycores of two key application software. Based on the whole research and development requirements of large scale scalable parallel software, we carry out three levels researches on physical modeling, parallel algorithm design and optimization methods for parallel software, and try to propose new scalable theory, physical and algorithm modeling methods, parallel programming framework and key techniques. This project will have important theorical and application value since we can provide support on theory, methods, platform, and key techniques for the software development of other key application field.

随着异构众核日渐成为未来E级超级计算系统主流体系架构,越来越多并行软件面临着性能难以连续线性可扩展和可移植的挑战。本课题针对全球气候和直接湍流模拟等重点应用领域并行软件研制中出现的上述难题,研究多层次不连续非线性可扩展理论和支持百万量级并行度的物理建模方法;针对其结构与非结构网格、FFT、稠密和稀疏线性代数等典型计算和通信模式,研究网络拓扑感知和通信避免可扩展并行算法,语义与资源感知的并行编程框架和基于模板自适应优化技术。采用物理建模-并行算法-并行软件-体系结构多层协同和融合的研究方法,实现百万量级异构众核并行可扩展应用示范。本项目从大规模并行应用软件研制整体出发,在物理建模、并行算法设计和并行软件优化方法等三个层次开展研究,相互融合形成新的可扩展理论、物理和算法建模方法、并行编程框架和关键技术,可为其它重点领域应用软件研制提供理论、方法、平台和关键技术支撑,具有重要理论价值和应用前景。

项目摘要

项目围绕高性能计算中可扩展性这一核心问题,沿着物理模型、并行算法设计、并行软件优化这一技术路线,以可扩展理论、新型并行算法、大规模并行软件、高效通信实现、并行编程模型等为研究内容,较为完整的形成了一套多层次应用协同设计优化的方法,并在三个重点应用领域进行示范。.首次发现E级大规模异构众核并行计算系统上的多层次不连续非线性可扩展现象并展开理论分析,提出了一套物理建模、并行算法设计和并行软件优化方法分层次可扩展的理论和方法体系,形成了新颖的应用-算法-体系结构两层协同设计思想,指导三个重点示范应用研究工作。论文发表在《计算机学报》上。.针对应用中的FFT、SpMV和Stencil等共性函数设计新颖算法和自适应优化实现,性能达到国际领先水平,性能分别优于FFTW、CUSPARSE、Pluto等国际知名软件包。论文发表在CCF A类会议SC、PPoPP、CCF A类期刊TPDS、B类期刊TACO、TOMS上。.提出一种语义和资源感知的异构众核系统并行编程框架AceMesh,实现数据驱动的细粒度任务并行,在国产神威平台对气候模拟热点函数性能提升49%,并应用在多重网格、粒子模拟等其他应用中。论文发表在CCF A类会议PPoPP和B类会议CC上。.全球气候模拟应用首次在国际上设计实现三维剖分方案并应用新颖跳点算法和高效通信优化方法,可扩展性提升两个数量级,突破十万核可扩展性瓶颈,获得2019年国家最高科技奖获得者曾庆存院士高度评价。相关结果将会被IPCC第六次评估报告采用。论文发表在CCF B类会议IPDPS上。.核材料数值模拟应用方面,研制出世界上第一款可进行千亿粒子模拟的OpenKMC软件,神威太湖之光上五百万核效率高于80%,已经交付中国原子能科学研究院进行模拟研究,成为国产核材料模拟软件生态的重要组成部分。论文发表在CCF A类会议SC上。.直接法湍流计算采用了基于通信动态拓扑模型优化,在神威太湖之光系统上实现了世界最大规模为16384立方的直接数值法湍流模拟,104万核性能40.2TFLOP/S。.项目共发表60篇论文,其中高水平论文25篇(国内历史上首次同一年同一研究组在SC上发表两篇正文,国内历史上首次连续三年在PPoPP上发表正文)。项目拟冲击2020年Gordon Bell奖,申请专利11项,软件著作权5项。培养博士生10名,硕士研究生10名。完成了预期目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
2

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
3

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

2000-2016年三江源区植被生长季NDVI变化及其对气候因子的响应

2000-2016年三江源区植被生长季NDVI变化及其对气候因子的响应

DOI:10.6046/gtzyyg.2020.01.32
发表时间:2020

张云泉的其他基金

批准号:61272136
批准年份:2012
资助金额:82.00
项目类别:面上项目
批准号:60303020
批准年份:2003
资助金额:24.00
项目类别:青年科学基金项目

相似国自然基金

1

面向激光聚变模拟的大规模异构众核系统可扩展并行算法与优化方法

批准号:61432005
批准年份:2014
负责人:李克勤
学科分类:F0201
资助金额:320.00
项目类别:重点项目
2

大型异构系统上数百万核可扩展的新型区域分裂隐式求解器研究

批准号:91530103
批准年份:2015
负责人:杨超
学科分类:A0501
资助金额:42.00
项目类别:重大研究计划
3

面向高性能异构众核架构的大规模CFD并行算法与应用

批准号:11502296
批准年份:2015
负责人:徐传福
学科分类:A0910
资助金额:20.00
项目类别:青年科学基金项目
4

面向异构众核系统的非规则问题优化技术研究

批准号:61303050
批准年份:2013
负责人:王珏
学科分类:F0202
资助金额:27.00
项目类别:青年科学基金项目