异构系统上基于任务窃取的负载平衡研究

基本信息
批准号:61303059
项目类别:青年科学基金项目
资助金额:23.00
负责人:马文静
学科分类:
依托单位:中国科学院软件研究所
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:郑晶晶,解庆春,颜深根,王伟俨
关键词:
任务窃取负载平衡异构系统
结项摘要

Nowadays, the mainstream supercomputers in the world are not always homogeneous. Many of them are equipped with accelerators such as GPUs. In large scale computation, load balance is a very important factor for performance and energy efficiency. Traditional task scheduling methods are not sufficient for achieving load balance on heterogeneous systems. This project will investigate load balancing method based on work stealing, mainly targeting at applications that can make good use of accelerators like GPUs. These applications include some chemistry computation such as TCE, SCF, and other applications like n-body problem. The main research topics are (1) Modifying the work stealing scheme. By using different task sizes, with coordination among queues for different processors, we can optimize the work stealing algorithms to get better load balance. (2) Using pipelining and kernel consolidation for tasks on accelerators, thus making good use of the computing research, to achieve load balance. (3) Optimizing the scheduling algorithm according to data locality, thus enabling more efficient access to global data. This project will explore the computing power of heterogeneous systems, providing insights for load balancing on Exascale systems.

当今世界主流的超级计算系统往往不是单一结构的,很多都配有GPU等加速器。在大规模计算当中,负载平衡对计算的性能、功耗至关重要。而传统的任务调度方法往往很难直接用于异构系统,使之实现负载平衡。 本项目将基于广泛使用的任务窃取方法,针对能够充分利用GPU等加速器的程序进行负载平衡研究。这类程序包括一些化学计算方法(TCE、SCF等)以及n-body问题等。主要研究内容包括:(1)改进任务窃取方案,通过使用不同大小任务、不同处理器任务队列调配等方法,优化窃取机制。(2)对加速器上的任务进行流水化和批处理,以充分利用计算资源,更好地实现负载平衡。(3)根据数据局部性对任务调度进行优化,使共享数据的访问更加高效。本项目的研究充分挖掘异构系统的计算潜力,为未来E级系统上的负载平衡研究提供基础。

项目摘要

本项目旨在通过研究任务窃取等负载平衡机制,提高并行系统性能。.在项目执行期间,我们着重调研和实现了一些重要的机器学习算法,对其进行并行化,并研究这些算法在并行运行中的特性。在对stencil计算的研究中,我们提出了一种新的面向计算重用的GPU上代码生成方法,利用计算重叠图对stencil算子进行分析,进而生成优化的GPU代码。此项工作成果发表在2016年《Journal of Computer Science and Technology》。.我们为Fisher Vector算法开发了GPU上的并行代码,并进行了优化。在使用了循环展开,条件分支语句集中判断,向量化等优化方法之外,我们对dense sift的代码实现做了改进,使之更易于并行化并提高性能。另外,我们将dense sift计算中图像的尺度从9个降到8个,去掉了最大尺度,性能大大提升,而实验证明精度与原算法非常接近。成果发表在2016年ICMR,代码已开源。我们的工作使Fisher Vector算法能够实时处理视频,为机器视频领域的研究和应用提供重要工具。.我们为structural SVM设计开发了GPU集群上的并行代码,使之在使用非线性核函数时仍然能处理海量数据。我们对原有代码做了大量优化,并通过使用和改进任务窃取机制,达到更好的性能优化效果。此项工作为序列预测类机器学习算法提供重要研究工具。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
3

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
4

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
5

天津市农民工职业性肌肉骨骼疾患的患病及影响因素分析

天津市农民工职业性肌肉骨骼疾患的患病及影响因素分析

DOI:
发表时间:2019

马文静的其他基金

相似国自然基金

1

面向服务的异构多核可重构片上系统任务自动并行化机制研究

批准号:61202053
批准年份:2012
负责人:王超
学科分类:F0204
资助金额:23.00
项目类别:青年科学基金项目
2

异构多核片上系统自适应实时任务调度机制及算法研究

批准号:60973030
批准年份:2009
负责人:徐成
学科分类:F0204
资助金额:30.00
项目类别:面上项目
3

基于学习的复杂并行绘制系统负载平衡算法研究

批准号:61472261
批准年份:2014
负责人:张严辞
学科分类:F0209
资助金额:80.00
项目类别:面上项目
4

基于I/O负载平衡的机群文件系统研究

批准号:60073010
批准年份:2000
负责人:沈美明
学科分类:F0204
资助金额:15.00
项目类别:面上项目