How to extend the parallelism of mainstream softwares on manycore architecture transparently, is a hot issue in current study. Up to now, only "big" hot loop structures are chosen as manycore thread candidates. This way wouldn’t exploit all effective parallelism in accelerating serial program on manycore architecture. The project proposes a software/hardware co-design method for tiny thread, which can expand "small" hot loop structures as new effective parallelism source. It divides the hard-to-parallel program into block–level tiny threads. The topics of the research include: compiler support for two level tiny thread representation, tiny thread partition method that can expand new effective parallelism, proactive synchronization between tiny threads and dynamic resource allocation mechanism in manycore. The target of this project is to propose a reasonable software and hardware co-design method for manycore architecture, which can balance the easy-to-parallel and efficient-to-parallel. It would also improve the effective parallelism, resource utilization and load imbalance problems in manycore architecture. It has important meanings for the high performance general-purpose chip architecture reasearch in future 2017 - 2025.
如何在众核结构上实现主流应用软件可并行性的透明扩展,是当前研究中的热点问题。针对目前众核加速串行程序均着眼于“大”热点循环结构而有效并行源不足的现状,本项目提出一种微线程式软硬件支持方法,通过拓展“小”热点循环结构为新有效并行源,使“微”线程划分深入到基本块内部,将计算和访存依赖不规则的串行程序划分成符合众核体系结构特征的微线程独立并行执行。主要研究内容包括:两层化微线程式串行程序表示形式的编译支持、拓展有效并行源的众核微线程划分方法、主动式微线程间同步通信的软硬件支持和符合微线程并行执行特征的动态资源分配机制。本项目的预期目标是提出一种拓展众核有效并行源的微线程式软硬件支持机制,平衡并行编程的易编程性和并行程序的执行效率,改善众核研究当前面临的有效并行源不足、片上资源有效利用率不高和负载不平衡等问题。对于探索2017-2025前后高效能通用微处理芯片体系结构的发展道路具有重要意义。
如何将计算和访存依赖不规则的串行程序合理并行化,为众核芯片提供更多的有效并行性来源,最大限度地开发出在众核上可利用的细粒度线程级并行性,是当前众核研究中的难点。针对目前众核加速串行程序均着眼于“大”热点循环结构而有效并行源不足的现状,本项目提出了一系列拓展“小”热点循环结构为新有效并行源的微线程式软硬件支持机制,从中间表示、线程划分、同步通信和动态资源分配机制开展研究:设计了一种小粒度的两层化微线程式串行程序表示形式,用以平衡并行编程的易编程性和并行程序的执行效率;提出了一种拓展有效并行源的众核微线程划分方法,从源头上增加众核结构上可利用的细粒度并行性,减少不必要的线程间无关依赖;提出了一种主动式同步通信软硬件支持机制,提高微线程间的同步通信效率;开展了典型应用在众核结构上执行时的动态行为分析,设计了符合微线程并行执行特征的动态资源分配机制;并结合科学计算等领域应用的特点开展了相关技术扩展研究。实验结果表明该方案能有效拓展众核并行性来源,提高微线程间的同步通信效率。其研究成果为后续研究提供了新的思路和方法,对众核芯片体系结构的发展道路进行了有益的探索。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
众核平台的并行编程模型及其运行时支持技术的研究
改善众核处理器并行编程的系统性方法
众核处理器结构上的并行程序执行模型
面向众核平台的高能效大规模图并行算法研究