With the development of cyber-physical systems (CPS), modern embedded systems are becoming very complex, in which massively parallel data processing is very common. GPU, as a high-performance parallel computing device, is widely adopted in embedded systems to meet data processing requirements. Embedded systems typically have real-time requirements, in which tasks must execute in a timely manner. Research on building real-time systems on GPUs is far from mature, which obstructs the development of high-performance real-time systems and related application domains, such as autonomous driving. This project conducts research on timing analysis and optimization techniques for real-time systems on GPUs, aiming to provide guarantee for safe deployment of real-time systems on GPUs. Detailed research topics include: (1) GPU program behavior control and hardware resource access control; (2) timing analysis techniques for GPU programs; (3) GPU program optimization techniques. We will also develop a timing analysis tool for real-time software running on GPUs, and build a vision-assisted auto-drive system to demonstrate the usability of the proposed methods. This project will help to clear some technical bottlenecks in building high-performance real-time systems on GPUs.
随着物联网技术发展,嵌入式系统的复杂度日益提高,需要并行处理大量传感数据。GPU作为一种大规模并行计算器件,正越来越广泛的被嵌入式系统所采用。嵌入式系统通常具有实时性要求,而面向GPU的实时系统时间分析与优化领域的研究还很不成熟,这成为了高性能嵌入式系统的发展瓶颈,也将阻碍相关应用领域(如自动驾驶)的发展。因此,本项目研究面向GPU的实时系统时间分析与优化技术,目的是为实时系统在GPU上的安全部署提供保证。具体研究内容包括:(1)GPU程序行为管控与资源访问管理技术;(2)面向GPU的时间分析技术;(3)GPU程序优化技术。结合以上研究,设计开发一个GPU实时程序时间分析工具,并基于视觉辅助自动驾驶系统构建应用示范。本项目将为面向GPU的高性能实时系统发展突破技术瓶颈。
GPU作为一种大规模并行计算器件,正越来越广泛的被实时嵌入式系统所采用。由于GPU硬件自身的复杂性与应用程序的复杂性相互叠加,如何保证并行应用程序在GPU上执行的时间可预测性成为重要挑战。. 本项目旨在为实时系统在GPU上的安全部署提供保证。具体围绕“程序行为管控与资源访问管理、程序时间分析、程序性能优化”三个方面开展理论与技术研究,主要贡献包括:. (1)时间可预测的程序行为管控与资源管理技术:研究了时间可预测的深度神经网络剪枝技术,解决了神经网络程序与GPU硬件执行特点不匹配导致的执行时间不可预测的问题;研究了具有任意截止期的有向无环图任务实时调度技术和多模式切换下的混合关键的调度技术,通过有效管控硬件资源,提高了应用程序的时间可预测性;研究了并行程序自旋锁性能分析技术,提高了带有资源共享行为的并行应用程序的时间可预测性。. (2)并行应用程序时间行为建模与时间分析技术:研究了嵌套并行任务分层调度与基于分组调度的并行任务调度,及其响应时间分析技术,解决了复杂并行任务时间行为建模的问题;研究了面向共享Cache的高效性能建模技术,提高了共享Cache下应用程序性能建模的效率;研究了GPU平台上的神经网络应用细粒度性能分析技术、动态Cache替换策略性能分析技术、有向无环图任务最坏情况响应时间分析技术,从不同层次提高了并行应用任务时间分析的精确性与效率。. (3)面向特定领域的并行程序性能优化技术:研究了基于移动GPU加速的二进制神经网络(BNN)推理性能优化技术,解决了BNN网络向移动GPU适配的问题;研究了基于聚集特征学习的人体动作识别技术,有效提高了人体动作识别类DNN应用的识别精度;研究了面向攻击防御的实时系统性能优化技术,在保障系统攻击防御效果的情况下提升了系统性能。. 基于以上研究,开发了一套面向GPU的深度神经网络应用细粒度性能分析工具以及一个支撑视觉辅助自动驾驶研究的微型车原型系统。本项目对于在GPU上部署安全关键的实时系统起到了一定推动作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于分形L系统的水稻根系建模方法研究
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
面向不规则GPU应用的分析与优化技术研究
面向多核处理器的并行实时软件设计、分析与优化技术研究
面向实时并发数据流的能耗优化的GPU集群可靠处理机制研究
基于GPU性能模型的异构系统优化技术研究