在新一代大规模并行计算机系统中,高功耗是不可回避的关键问题之一。过高的功耗给并行系统的可靠性、稳定性带来了诸多问题,并增加了系统运行成本,成为制约大规模并行计算机系统发展的严重障碍。目前,针对大规模并行系统的低功耗研究正在成为国际研究热点。我们借助银河系列高性能计算机研制的丰富经验,从低功耗的角度出发,展开面向大规模并行计算机系统的多项软件低功耗关键技术研究。项目基于大规模并行计算特点,主要内容包括OpenMP 并行循环调度的低功耗技术、MPI 全局操作的低功耗技术和计算与通信重叠的低功耗技术。我们从研究内容合理性、可行性等多方面加以了论证。通过论证,我们认为上述技术是降低系统功耗行之有效的软件技术。
本项目借助银河系列、天河高性能计算机研制的丰富经验,从能量优化角度出发,围绕构成大规模并行计算机系统的几个关键领域,展开了低功耗优化的技术研究,取得了一系列研究成果:(1)提出了基于OpenMP循环调度的结点机能量优化技术,将DVS和调度算法有机结合获得了性能和能量的有效平衡,分别从性能约束下的能量最优和能量约束下的性能最优两个角度展开研究,算法包括:EOSS,IEOSS,ECSS和ECPOSS;(2)提出了CPU/GPU异构系统功耗感知的并行循环调度技术以及Kernel Fusion技术,通过建立整数规划问题模型并求解,获得了时间约束下异构系统并行循环调度的能耗下界。进一步,对Kernel间不存在数据相关性和存在数据相关性的两种情况均提出了Kernel合并策略,提高了GPU执行能效;(3)提出了动态核心关闭与动态频率调节的混合低功耗优化技术,降低了访存受限程序的能耗开销。提出了异构系统的功耗管理策略,建立了异构体系结构程序能耗优化模型,给出了异构处理器并行执行能效平衡定理以及同构程序段功耗平衡定理;(4)针对MPI操作中最常见的一类barrier操作,提出了基于LogP指导的MPI barrier能量分析模型及优化算法,建立了combining tree barrier,tournament barrier和central counter barrier的能量优化分析模型,挖掘了这三类barrier算法中存在的大量空转等待时间,进行处理器关闭,基于Open MPI coll框架中的实现验证了分析模型的结果和实际模拟的结果偏差不大;(5)针对互连网络静态能量问题,从路由器关闭角度,提出了基于通信区间平移的路由器时间维度划分方法,提高路由器的可关闭时间比例,具体提出了两个算法:最大连续占用的时间区间划分算法和基于通信区间平移的最大连续占用的时间区间划分方法,用以指导路由器时间上的关闭;(6)从理论上分析了磁盘调度序列、磁盘能量消耗和IO请求响应时间三者之间的关系,提出了平衡能量与响应时间的基于lazy调度的磁盘能量优化算法,该算法基于响应时间采用反馈的方式自适应地调整时间窗口大小,达到了磁盘能量优化和请求响应时间的有效平衡。
{{i.achievement_title}}
数据更新时间:2023-05-31
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
一种改进的多目标正余弦优化算法
基于混合优化方法的大口径主镜设计
变可信度近似模型及其在复杂装备优化设计中的应用研究进展
涡轮叶片厚壁带肋通道流动与传热性能的预测和优化
面向大规模并行计算机系统的应用级检查点关键技术研究
嵌入式软件低功耗设计关键技术研究
面向混合内存的系统软件机理和关键技术研究
面向新型异构众核系统的多设备协同并行计算关键技术研究