E级计算系统中基于SSD的高性能高可靠IO节点子系统关键技术研究

基本信息
批准号:61402503
项目类别:青年科学基金项目
资助金额:24.00
负责人:陈志广
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:王蓉辉,张航,孙振,余松平,邓明翥,李硕,巫小泉,陈祥
关键词:
IO节点输入输出子系统高性能计算固态盘并行文件系统
结项摘要

The emerging Exascale computing systems are mostly likely to be prohibited by the IO subsystem. By considering that IO node is an efficient method improving IO performance in high performance computing systems, this work proposes to deploy the SSD-based IO node into Exascale computing systems. In such a novel IO subsystem, there are three issues should be addressed. First, the reliability of IO node must be considered seriously as SSDs survive limited lifespan. Second, SSDs are able to supply a plethora of bandwidth which cannot be completely exploited by existing software stack. Third, simply introducing IO nodes into high performance computing system fails to improve the backend storage systems. Accordingly, this work aims at building a reliable as well as high performance IO node cluster by taking measures in three aspects. First, we explore novel architecture that enhances the reliability of SSD-based IO node. Based on the reliable platform built above, we optimize the parallel file system to make IO nodes be capable of responding to ultra-concurrent IO requests. Finally, we develop some intelligent mechanism to optimize the interaction between IO nodes and the backend parallel file system, thus improving the backend storage system as well. Technologies proposed in this research are promising to be applied to the emerging Exascale computing systems.

在未来的E级高性能计算系统中,IO子系统将是重要的瓶颈之一,而引入IO节点则是提高IO性能的有效手段。本研究拟在E级高性能计算系统中引入基于固态盘的IO节点系统。在此子系统中存在三方面的问题:(1)固态盘寿命有限,基于SSD的IO节点系统可靠性问题尤其突出;(2)固态盘能够提供空前的性能,但现有软件系统不能充分发挥基于SSD的IO节点系统的优势;(3)简单引入IO节点系统并不能完全消除后端存储系统的性能瓶颈。相应地,本项目从三个方面展开研究:基于固态盘的IO节点系统高可靠体系结构、面向高性能IO节点系统的数据并发访问技术、面向后端存储系统的IO节点系统优化技术。研究的成果将确保基于固态盘的IO节点系统稳定可靠和性能充分发挥,相关技术将应用到未来的E级高性能计算系统中。

项目摘要

E级计算系统将包含十万量级的计算节点和千万量级的处理器核心,相应地,在如此规模的系统上运行的E级应用将派生出千万量级的进程,大量进程的并发IO势必对底层文件系统形成强大的压力。近年来,以闪存为代表的非易失存储介质发展迅速,在计算系统中配备IO节点、并通过非易失存储介质增强IO节点的IO能力,是缓解E级系统中IO瓶颈的有效手段。本项目主要研究基于SSD的IO节点子系统,并延伸到RRAM、STT-RAM等新型非易失存储介质,重点解决IO节点子系统面临的可靠性、并发性问题。具体研究点包括:基于固态盘的IO节点系统高可靠体系结构、面向高性能IO节点系统的数据并发访问技术、面向后端存储系统的IO节点系统优化技术。在三年执行周期内,项目研究团队取得一系列成果:采用重复数据删除技术将SSD写性能提升21%;采用盘内缓存技术克服了读干扰问题;设计了基于Flash和DRAM的Ultra-DIMM混合主存系统;论证了采用纠删码技能能够将SSD寿命延长百倍以上;提出了多种针对SSD的编码方法;提出了基于图模型的文件系统名字空间管理方法;设计了新型的并行文件系统元数据组织结构;采用Key-Value系统构建元数据存储系统;采用代理技术缓解元数据瓶颈问题;利用SSD缓存提高文件系统的并发性;最终汇聚以上技术实现了面向高速IO加速节点的并行文件系统原型,并在其上展开应用优化研究。研究过程中发表论文16篇,其中CCF A类期刊1篇,CCF B类会议2篇,SCI检索4篇,EI检索14篇,两篇国内会议论文被评为优秀论文推荐到一级学报《计算机研究与发展》,申请专利11项。项目研究成果对E级计算系统中的IO子系统构建具有重要指导意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
2

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

DOI:
发表时间:2020
3

采用黏弹性人工边界时显式算法稳定性条件

采用黏弹性人工边界时显式算法稳定性条件

DOI:10.11883/bzycj-2021-0196
发表时间:2022
4

计及焊层疲劳影响的风电变流器IGBT 模块热分析及改进热网络模型

计及焊层疲劳影响的风电变流器IGBT 模块热分析及改进热网络模型

DOI:10.19595/j.cnki.1000-6753.tces.151503
发表时间:2017
5

金属锆织构的标准极图计算及分析

金属锆织构的标准极图计算及分析

DOI:10.16112/j.cnki.53-1223/n.2019.02.003
发表时间:2019

陈志广的其他基金

批准号:61872392
批准年份:2018
资助金额:66.00
项目类别:面上项目

相似国自然基金

1

面向E级计算可靠性墙问题的关键技术研究

批准号:61303068
批准年份:2013
负责人:王之元
学科分类:F0204
资助金额:23.00
项目类别:青年科学基金项目
2

面向E级计算的高突发带宽I/O缓冲存储系统关键技术研究

批准号:61802418
批准年份:2018
负责人:欧洋
学科分类:F0204
资助金额:25.00
项目类别:青年科学基金项目
3

基于可重构计算的高可靠星载计算系统关键问题研究

批准号:61802122
批准年份:2018
负责人:任小西
学科分类:F0214
资助金额:21.00
项目类别:青年科学基金项目
4

基于软硬件协同的数据中心SSD缓存系统关键技术研究

批准号:61502448
批准年份:2015
负责人:蒋德钧
学科分类:F0204
资助金额:21.00
项目类别:青年科学基金项目