GPU程序访存行为分析和优化关键技术研究

基本信息
批准号:61402488
项目类别:青年科学基金项目
资助金额:25.00
负责人:唐滔
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:彭林,张雪萌,张百达,陈呈,徐振
关键词:
性能分析模型性能优化访存行为分析图形处理器
结项摘要

Graphics Processing Unit (GPU) has attracted much interests in high performance computing area due to its powerful computing performance. With massive parallel computing cores, GPU's peak performance far ex ceeds that of contemporary CPU. However, real applications usually cannot efficiently exploit GPU's potential computing ability. The major factor lies in the "memory wall" problem. Therefore, analysis and optimizations oriented to on-chip memory hierarchies are of great importance to improve the performance of GPU programs. Based on deep analysis of GPU's multi-thread executing model, this program will perform researches on on-chip memory access analysis and optimizations for GPU programs. The key contents cover the following two aspects: proposing analysis model of the impact of on-chip memory accesses on the performance, including the software managed shared memory and the hardware managed cache; proposing data access optimizations for shared memory and cache respectively. With these results, we expect to improve the usage of GPU's on-chip memory hierarchies, reduce the off-chip memory accesses and efficiently exploit GPU's potential computing ability.

图形处理器(GPU)以其强大的峰值计算能力渐渐成为高性能计算领域研究的热点。由于集成了大量并行的计算核心,GPU 的峰值计算性能远远超过同时期的通用 CPU,然而真实程序往往很难将其计算潜力有效发挥出来,其中“存储墙”问题是制约GPU性能发挥的最主要因素,因此面向GPU片上存储层次的分析和优化对于提高GPU程序的性能具有重要意义。本项目基于对GPU执行特点的深入探索和分析,展开GPU片上存储访问的分析和优化研究,关键内容包括两方面:一是建立GPU片上存储层次访问对程序性能影响的分析模型,包括软件管理的shared memory和硬件管理的cache;二是提出若干面向shared memory和cache的数据访问优化技术。我们希望通过这些研究成果,有效提升GPU片上存储层次的利用率,减少片外访存,充分开发GPU的计算潜力。

项目摘要

由图形处理器(GPU)作为加速器构建异构并行系统已经成为高性能计算领域最常采用的技术路线之一。由于降低了核心的复杂度,GPU往往集成了大量的并行的计算核心,其峰值性能远超同时期的通用CPU,但真实程序的性能发挥严重依赖于访存性能的发挥。因此,面向GPU片上存储层次的分析和优化对于提高GPU程序的性能具有重要意义。本项目基于对GPU多线程执行模式的分析,建立了GPU片上存储层次访问对程序性能影响的分析模型,并基于此提出了若干面向shared memory和cache的数据访问优化技术,可以有效提升GPU片上存储层次的利用率,减少访存,从而提升GPU的实际计算性能。本项目在国内外会议和期刊上公开发表论文9篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
4

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021
5

药食兼用真菌蛹虫草的液体发酵培养条件优化

药食兼用真菌蛹虫草的液体发酵培养条件优化

DOI:
发表时间:2021

唐滔的其他基金

相似国自然基金

1

多核平台上的动态访存优化

批准号:61303051
批准年份:2013
负责人:王振江
学科分类:F0203
资助金额:27.00
项目类别:青年科学基金项目
2

GPGPU访存系统中共享资源管理和调度的关键技术研究

批准号:61702485
批准年份:2017
负责人:常轶松
学科分类:F0204
资助金额:29.00
项目类别:青年科学基金项目
3

访存模式感知的自适应智能存储体系结构及关键技术研究

批准号:61402501
批准年份:2014
负责人:王蕾
学科分类:F0204
资助金额:24.00
项目类别:青年科学基金项目
4

大容量固态硬盘地址映射表优化设计与访存优化研究

批准号:61802133
批准年份:2018
负责人:潘玉彪
学科分类:F0204
资助金额:23.00
项目类别:青年科学基金项目