As device feature size continues to shrink, it is possible to build a cluster on a single chip. However, the contentions among applications, which are simultaneously running on the same chip, will significantly degrade the system performance and violate user QoS requirements. To address this problem, Network-on-Chip (NoC) virtualization technology suggests allocating different applications into separate sub-networks. However, state-of-the-art NoC virtualization technologies have some limitations. First, the topology of sub-network should be orthogonal convex at least. This will lead to a large number of system fragments and dramatically degrade system utilization. Second, all sub-networks utilize a same routing algorithm optimized for the worst case. The second problem will lead to a system that is running at its sub-optimal state. The main reason behind above two problems is the absence of a routing deadlock avoidance mechanism. This mechanism is not only used to avoid routing deadlock in sub-networks whose topologies are complementary to orthogonal convex regions, but also used to design the reconfigurable routing algorithm. The reconfigurable routing could exploit applications' traffic information to dynamically reconfigure the routing rules in each sub-network. Thus, network performance could be optimized by dynamically balancing the network traffic. Furthermore, the reconfigurable routing algorithm should exploit an efficient routing reconfiguration algorithm to minimize the performance loss due to the routing reconfiguration. To achieve above objectives, this project will focus on the design of the routing deadlock avoidance mechanism, the corresponding reconfigurable routing algorithm and the efficient routing reconfiguration algorithm.
芯片特征尺寸的不断减小使得在单芯片内构建集群成为可能。然而,由于不同应用程序在片上网络内的相互干扰,导致无法保证用户的服务质量。片上网络虚拟化技术通过将应用分配到相互隔离的子网内,可以部分地解决这个问题。然而,目前该技术还并不完善。首先,其不支持正交凸互补子网,从而导致系统资源利用率低。其次,每个子网内使用相同的、针对最坏情况设计的路由算法,从而导致系统始终运行在次优状态。造成以上两个问题的原因是缺少一个针对正交凸互补网络的路由死锁避免机制。这个机制不但可以保证正交凸互补网络的路由无死锁,并且可以使得路由具有重构能力。可重构路由可以利用应用的流量特性,动态调整子网内的路由规则,提高网络性能。另外,可重构路由算法依赖于一种高效的路由重构机制,以保证路由重构不会降低网络性能。为了达到以上目标,本课题拟针对正交凸互补网络的路由死锁避免机制,相应的可重构路由算法和高效的路由重构算法展开研究。
随着芯片特征尺寸的不断减小,单芯片内部可以集成的处理器核心数量显著增加。为了充分利用芯片内部丰富的计算资源,业界提出在单个芯片内进行云计算的解决方案,即单芯片云计算机(Single-chip Cloud Computer, SCC)。与传统的计算方式不同,SCC的显著特征就是通过虚拟化技术来实现多租户对底层硬件资源的共享。这虽然可以有效提升系统资源的利用率,但是也不可避免的带来了租户间的相互干扰,从而导致服务质量无法保证。其中,片上网络作为部件之间通信所依赖的核心组件,其性能扰动和干扰将严重影响租户程序的服务质量。为了解决这个问题,传统的解决方案是将不同的应用程序划分到不同的区域中,并且通过路由的方式确保区域内的节点不会访问区域外的节点或链路。这种策略的基本思想是通过流量的隔离来避免流量之间的干扰。上述方法实现简单,但是也同时存在3个显著的问题。首先,矩形区域的子网隔离方案导致网络碎片化、系统资源利用率低。其次,任意形状子网虽然系统利用率高,但却需要使用较复杂的路由算法,从而导致网络性能的下降。最后,在当前的多核芯片架构中,内存控制器仍然以分布在芯片四周为主流,因此访存流量很难被彻底隔离。为了解决上述问题,本课题针对正交凸互补拓扑展开研究,研究其可重构路由算法、路由批量重构机制、虚拟网络共享机制和大规模仿真平台。具体来说,项目研究了ZoneDefense可重构路由算法。该算法将网络中的一个个虚拟子网等效为故障区,然后在子网外部利用构建的防守区来进行路由,从而确保区域间的隔离。另外,项目组提出的RISO片上网络虚拟子网共享方案提出了共享低负载链路的思想。与传统的子网隔离策略不同,RISO首先监控并预测不同应用在同一个链路上的负载情况,并通过预先设定的性能检测方法来确保链路的共享不会导致每个应用的性能下降。RISO的好处在于一方面保证了子网区域的规则性,另一方面又显著提高了系统的资源利用率。最后,项目组研发的DCNSim大规模并行模拟器可以实现对处理器、内存和网络的全系统建模,并且可以运行真实的操作系统,这对于在云计算环境下研究下一代新型互连网络具有重要意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
内点最大化与冗余点控制的小型无人机遥感图像配准
面向云工作流安全的任务调度方法
城市轨道交通车站火灾情况下客流疏散能力评价
网络虚拟化中虚拟网映射问题的关键技术研究
复杂SoCs片上通信关键技术研究
基于差分CDMA的高性能片上互连网络关键技术研究
量子密钥分发的网络化及关键器件的片上实验实现研究