The speed gap between process and memory has long been the main performance bottleneck of computer system. Multi-core architecture improves the process capability, but not the memory bandwidth, making the latter another bottleneck. Analyzing runtime memory behavior and relieving the memory problems by dynamic optimization is of great research value. We will research on the following issues. (1) Multi-threaded memory pool allocation. It profiles runtime information and manages data layout at allocation time. Besides, it can fit various memory access characteristics in multi-threaded programs, and can detect, predict and handle false sharing. (2) Dynamic data layout rearrangement. It can safely move data at runtime with little overhead when hot memory access sequence changes. (3) Memory contention model and scheduling algorithm. Instead of a limited single metric, the model uses several metrics and describes the degree of memory contention. It can provide better direction to task scheduling as well as some other optimizations. The research targets the memory wall problem from various aspects, including allocation time, post allocation time, and memory contention. The research will improve the overall performance of computer system.
长期以来,处理器和内存间的速度差异一直是计算机系统的主要性能瓶颈。多核平台增强了总运算能力却没有同比提高访存带宽,使带宽又成为另一个瓶颈。分析程序在运行时的访存行为,利用动态优化技术缓解访存"慢"和"挤"的问题,是具有重要研究价值的课题。 项目准备在以下三点寻求突破:(1)多线程内存池优化。通过动态运行信息抓取和数据布局,在改善数据局部性的同时,适应多线程程序的不同访存模式,检测、预测和处理假共享。(2)数据动态重布局。研究运行时安全、低开销的移动数据的方法,适应不断变化的热访存序列。(3)访存竞争模型和任务调度算法。为弥补单一数据指标的偏差和局限性,研究综合了多项指标的访存竞争模型,为任务调度等优化提供更好的指导。 研究成果将从分配时和分配后的数据布局、访存竞争等不同角度缓解存储墙问题,提高计算机系统的整体性能。
处理器和内存之间的速度差异一直以来就是计算机系统的主要性能瓶颈。在多核平台上,处理器的运算能力进一步增强,而访存带宽却不能同比提高,这一差异又变得更大。通过分析程序在运行时的实际访存行为,利用动态优化技术缓解访存“慢”和“挤”的问题,是具有重要理论意义和实用价值的研究课题。.本项目对多线程访存行为的剖析方面进行了研究,提出了一种记录函数调用路径的方法,相比已有方法显著降低了记录开销,从而提高了剖析的效率。针对并发多进程的整体公平性,本项目扩展了之前的调度研究成果,通过跨执行优化在基本不损害公平性调度效果的前提下降低了运行开销。针对多进程在计算机各个存储层次上的竞争特点,实现了可灵活配置内存/高速缓存划分方法和相关配置规则,可稳定提升并发多进程的性能。随着多核系统研究的深入,多线程调试测试方法有了越来越重要的作用。针对多线程程序难以确定错误根因的问题,本项目提出了一种利用正确运行的信息辅助定位的方法,在错误难以重现的场景下也可以尽快定位。记录-重放系统是调试多线程程序的一种重要手段,本项目针对其开销很大的问题,利用处理器中的局部时钟来加速记录-重放系统。针对动态优化常用的二进制重写技术,本项目研究了对其进行随机测试的方法,提高了测试的覆盖率。针对跨ISA虚拟机运行速度慢的问题,本项目研究了利用宿主机硬件加速的方法。.以上研究成果累计发表CCF评定的A类国际会议/期刊3篇,B类国际会议论文4篇,提交相关专利2项。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
内点最大化与冗余点控制的小型无人机遥感图像配准
面向云工作流安全的任务调度方法
服务经济时代新动能将由技术和服务共同驱动
大容量固态硬盘地址映射表优化设计与访存优化研究
GPU程序访存行为分析和优化关键技术研究
视频应用中运动估计算法的并行与访存优化研究
高通量众核处理器访存数据通路优化研究