未来ExaFLOPS级超高性能计算已经对微处理器体系结构研究提出紧迫的需求。传统通用处理器架构的性能提升空间有限,新型处理器架构往往因改变用户编程习惯而难以迅速推广。本项目基于向量和多线程编程模型,提出一种众线程宽向量微体系结构,利用宽向量的数据并行提高峰值性能,利用众线程的交叉执行提高实际性能。主要研究内容有:(1)面向高性能计算的宽向量指令集扩展,包括向量宽度的设计、向量寄存器扩展和向量操作指令扩展等。(2)众线程宽向量执行模型,包括指令调度策略、向量执行部件设计、存储系统设计和访存调度策略,以及微体系结构设计空间探索等。(3)模拟器设计,支持快速功能模拟器和精确的多指标细节模拟,基于典型程序的模拟测试来验证众线程宽向量微体系结构的有效性。本项目的研究成果将为未来高性能计算做技术储备,为传统程序进一步提高性能提供硬件基础,为提高国产CPU设计能力和实用性能贡献力量。
未来超高性能计算对微处理器体系结构研究提出了紧迫的需求。传统通用处理器架构的性能提升空间有限,新型处理器架构往往因改变用户编程习惯而难以迅速推广。本课题提出了一种MTV众线程宽向量微体系结构,将SIMD模式的宽向量处理技术和众线程技术相结合,通过向量处理技术获得高峰值运算能力,通过众线程技术隐藏长延迟操作,将峰值运算能力转化为实用运算能力。.本课题的主要进展和成果如下:.1.定义了面向科学计算的通用SIMD向量指令扩展。基于基本的RISC指令集,面向超高性能计算应用需求特点,本课题提出了一套向量寄存器、向量指令扩展方案,并定义了指令操作类型与编码、指令的中断与异常、向量与标量的存储模型等。.2.提出了结合众线程与宽向量技术的MTV微体系结构。提出了多路分组交叉多线程的向量执行模式,并研究了指令发射调度、指令取指调度和访存调度等多线程调度策略。.3.提出高带宽向量数据批量载入机制。针对向量数据量大、指令吞吐率低的特点,提出一种批量数据载入机制,一次可以载入多个向量数据,大幅度提高了多线程向量数据加载的带宽。.4.提出了MTV体系结构的矩阵乘性能分析理论模型。使用矩阵乘这一科学和工程应用的内核算法,构造了一个性能分析模型,并分析了MTV体系结构的性能。.5.开发了MTV体系结构模拟器。面向MTV微体系结构,设计实现了指令功能模拟器和性能模拟器,对MTV体系结构的概念进行验证。并提出了一种CPADSE设计空间探索方法,加速了基于模拟器的性能分析研究。.6.实现了MTV体系结构的原型系统。基于通用FPGA开发板,实现了一种MTV的原型系统,该系统可以引导操作系统内核,并执行测试程序。该原型系统对MTV体系结构进行了更真实的验证。.本课题发表论文33篇,申请专利8项,培养研究生8名。.本课题完成了计划书中的全部研究内容,根据项目进展对研究内容进行扩充,并为软硬件协同优化、设计空间探索加速、基于原型系统的测试验证等工作开拓了新的起点。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LASSO-SVMR模型城市生活需水量的预测
基于分形维数和支持向量机的串联电弧故障诊断方法
基于图卷积网络的归纳式微博谣言检测新方法
极地微藻对极端环境的适应机制研究进展
瞬态波位移场计算方法在相控阵声场模拟中的实验验证
面向数据密集计算的超高性能多核处理器体系结构研究
基于EPIC的动态同时多线程微体系结构研究
面向异构众核系统的动态细粒度线程映射优化研究
面向多核/众核体系结构的评估方法研究