Coarse-grained reconfigurable architecture (CGRA) has higher parallelism and lower power consumption, which enables its promising application for both high efficient civil computing and high reliability space computing realms. However, the ever decreasing technology size makes ground computing devices more susceptible to soft error than before, impeding the application of CGRA in high performance and high reliability fields. Hence, focusing on the soft error issue in CGRA, this research explors new CGRA architecture with flexible reconfigurability both in its functionality and reliability, and proposes multi-realm adaptive soft error mitigation methodology. Firstly, based on a general architectural model of CGRA, soft errors can be modeled and characterized. Secondly, the effectiveness, compatibility and mutual implication of the various mitigation schemes are evaluated. Finally, a CGRA architecture with adaptive mitigation capability is proposed with a complete verification platform, as well as the adaptive mitigation scheme for the general CGRA architecture. Currently the soft error issue and its adaptive mitigating methodology have not yet been fully addressed, and its application in high rebility enviroment is also missing. Therefore, combining the two subjects, our reasearch would essentially advance the soft error reliability theories for CGRA, and further promotes its application in both high efficiency and high reliability fields.
粗粒度可重构计算架构(CGRA)高并行、低功耗的特点使其在民用高效能与空间高可靠计算领域具有广阔的应用前景。但随着工艺尺寸的持续缩小,地面环境下同样面临日益严峻的软错误影响,这严重阻碍了CGRA架构在高性能高可靠领域的应用。因此本课题针对CGRA架构的软错误问题,探索功能与可靠性均可灵活重构的新型CGRA架构,研究适用不同领域、具有自适应能力的软错误防护方法。首先抽象CGRA的通用架构模型,籍此对软错误效应模型及评估方法进行研究;然后开展对各类软错误防护方法不同效果、相容性及相互作用的评估;构建具有自适应防护能力的CGRA架构模型及验证平台,最终给出CGRA通用架构下软错误自适应防护的一般方法。当前CGRA架构的软错误问题及自适应防护方法尚未得到充分关注,更缺乏高可靠环境下的应用研究,因此本课题对两者的结合必将推动CGRA架构软错误可靠性理论的发展,拓展其在高效能、高可靠计算领域的应用。
高效能的粗粒度可重构计算架构(CGRA)由于互连复杂、集成度高导致对软错误较为敏感,因此本课题对CGRA相关的软错误分析与防护问题进行了研究。. 首先对CGRA的通用架构模型进行了总结,给出了CPU+RPU(可重构计算单元)的通用可重构架构模型,构建了包含OR1200处理器核和由64个PE单元组成的RPU的粗粒度可重构处理器RORP,并进行了SystemC建模,可方便的用于后续软错误的研究,其中OR1200处理器的电子系统级ESL建模属首次完成。. 接下来,针对软错误率评估问题进行了深入研究,开发了一系列软错误率评估的方法及工具。为细致评估互连对系统软错误率的影响,开发了电路级的软错误率评估方法及工具ASSET-SPI;开发了快速评估门级网表电路软错误率的方法及工具ASSET-VLG;为快速评估复杂ESL级系统的软错误率开发了2套不同的SystemC级的仿真故障注入方法及工具,分别针对SystemC的Port与Signal进行仿真软错误注入。特别是针对SystemC的Signal进行软错误注入的巩固ASSET-SC,可以完全自动化进行软错误率的评估,具有方便、快捷的特点,相关方法尚未见报道。. 最后对CGRA的低代价容软错误加固技术进行了研究,针对CGRA的RPU包含大量计算单元的特点,对PE单元结构进行了改进,使得每个PE都可以作为三模冗余(TMR)的表决器,从而可以以很低的代价引入TMR加固机制。同时对其它容软错误加固机制如ECC也进行了探索。. 整体而言,本课题的研究发现:i)虽然组合逻辑电路的软错误日益受到重视,但当前触发器和存储器的软错误仍然居于主导地位,考虑到CGRA架构内部包含大量存储部件,对其软错误防护仍应集中于存储器件的保护;ii)互连对系统的软错误有明显的影响,对于简单电路如果不考虑互连,对软错误率的估计会导致严重偏差,但目前对于复杂片上系统如何评估互连对系统软错误率的影响仍是待解决的难题;iii)CGRA本身的结构特点为低代价的软错误防护提供了更广的设计探索空间,可靠性可配置的CGRA架构具有良好的研究与应用价值,本课题的研究结果对于CGRA架构在软错误方面的研究具有借鉴意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
硬件木马:关键问题研究进展及新动向
新疆软紫草提取物对HepG2细胞凋亡的影响及其抗小鼠原位肝癌的作用
甘肃省粗颗粒盐渍土易溶盐含量、电导率与粒径的相关性分析
基于可拓学倾斜软岩巷道支护效果评价方法
大规模MIMO信号处理粗粒度可重构计算方法研究
多粒度可重构视觉处理芯片的设计研究与架构优化
基于可编程数据流计算的粗粒度可重构SoC设计方法研究
高效粗粒度可重构阵列计算关键技术研究