3D NoC stacking the multi-chips with TSV has many advantages, such as high integration density and high communication efficiency. It is the mainstream of communication architecture on multi-core and many-core systems. However, due to the process variation, physical defects and low yield of TSV, 3D NoC is facing serious problems. It is essential to design a fault-tolerant mechanism for 3D NoC to ensure the efficiency of communication. Our project will explore an adaptive method to select an optimal fault-tolerant strategy, which is based on the three basic phases of 3D NoC communication. Firstly, we research an adaptive fault-tolerant mechanism based on granular partition to overcome the limitation of traditional extensive fault-tolerant based on FIFO fault granularity partition. Secondly, we design a highly reliable crossbar through the redundancy of key component to ensure normally communication under fault conditions. Thirdly, we explore an adaptive fault-aware routing algorithm to minimize the degradation of chip performance in the event of a TSV failure. Lastly, to mask the fault TSV, we explore a high-efficiency fault-tolerant strategy using the adaptive TSV controller. By researching the adaptive fault-tolerant architecture of 3D NoC, our project will provide theoretical method and key technology for the reliability of 3D ICs.
三维片上网络通过硅通孔(TSV)将多层芯片进行堆叠,具有集成密度大,通信效率高等特点,是片上多核及众核系统的主流通信架构。然而工艺偏差及物理缺陷所引发的错误和TSV良率较低等因素,使得三维片上网络面临严重的故障问题。为保证通信效率,对三维片上网络进行容错设计必不可少。本课题拟以三维片上网络通信的三个基本阶段为主线,研究能够根据故障状态动态选择最优容错策略的自适应容错方法。首先,研究基于FIFO故障粒度划分的自适应容错方法,突破传统粗放式FIFO容错的局限;其次,设计针对关键部件冗余加固的高可靠交叉开关,在故障状态下保证芯片正常通信;再次,探究能够感知TSV故障的自适应容错路由算法,在TSV出现严重故障时,使芯片通信性能损失降到最小;最后,研究基于自适应TSV控制器的高效容错策略,屏蔽TSV故障。通过本课题的研究,建立系统的自适应容错体系,为提升三维集成电路的可靠性提供理论方法和关键技术。
三维片上网络采用硅通孔(TSV)堆叠多层芯片,是片上多核系统的主流通信架构。然而工艺偏差及物理缺陷所引发的错误和TSV 良率较低等因素,使得三维片上网络面临严重的故障问题。为保证通信效率,本课题以数据在三维片上网络中通信传输的三阶段为主线,展开相应的研究工作。在FIFO自适应容错、关键部件冗余容错、自适应路由算法、TSV冗余与串行化结合的自适应容错方法研究等方面取得了创新型成果:.1).提出一种故障感知的RVOQ 容错架构设计。在网络出现多个故障、面临网络重负载时, 仍然能够保证系统的高可靠性以及传输性能。.2).提出一种相邻虚通道循环共享的VOQ容错路由器设计。有效提高片上网络系统可靠性,保证系统性能,资源利用最大化。.3).提出一种针对瞬时和间歇性故障的高可靠链路容错方法。具有低延迟、高吞吐率、高可靠性特点,系统性能得到较好的保证。.4).提出一种基于路径树的无冲突测试调度方法。该方法可有效地避免资源冲突、减少测试时间、保证测试可靠性。.5).提出一种故障通道隔离的低开销容错路由器设计。该设计节约网络硬件资源,提高网络吞吐率,在故障率较高的网络中能保持较好的容错效果。.6).在IEEE TRANSACTIONS ON COMPUTERS、IEEE Transactions on Nuclear Science、IEEE VLSI TEST SYMPOSIUM (VTS)、Euromicro International Conference on Parallel, Distributed, and Network-Based Processing (PDP)、INTEGRATION, the VLSI journal、计算机学报、计算机研究与发展、电子学报、仪器仪表学报、计算机辅助设计与图形学学报等国内外著名期刊和会议上发表学术论文45篇(SCI、EI收录35篇);授权发明专利3件;培养出15名硕士。.本课题建立了系统的三维片上网络自适应容错模型,针对数据存储、转发以及链路传输中的故障,提出了相应的解决办法。本课题的相关研究成果,为片上网络通信和集成电路可靠性等方面的进一步研究和实践提供了参考和借鉴。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
基于自适应干扰估测器的协作机器人关节速度波动抑制方法
含饱和非线性的主动悬架系统自适应控制
基于速变LOS的无人船反步自适应路径跟踪控制
城市生活垃圾热值的特征变量选择方法及预测建模
三维片上网络通信SoC及安全性研究
片上网络通信模型GNLS及动态可重构无缝切换方法的研究
基于自适应双向时钟拉伸的VLSI时序余量片上消除方法及其电路实现
面向成品率的三维片上网络TSV容错技术研究