面向集群式内存的容错机制和数据组织策略研究

基本信息

批准号：61572209

项目类别：面上项目

资助金额：64.00

负责人：黄建忠

学科分类：

依托单位：华中科技大学

批准年份：2015

结题年份：2019

起止时间：2016-01-01 - 2019-12-31

项目状态：已结题

项目参与者：吴非,万继光,林川,钱璐,代尔卫,王艳群,黄文胜,蔡颖

关键词：

内存存储数据恢复集群存储数据布局大规模存储系统

结项摘要

The in-depth analysis reveals that the overall performance of clustered storage is still restricted by secondary storage such as hard disks. Clustered memory constituted from available DRAM via high-speed network can accomplish high-IOPS, low-latency data accesses, thereby potentially boosting the access performance of clustered storage. Focusing on both fault-tolerance and data organization technical challenges occurred in clustered memory, this project proposes a log-structured erasure-coded memory cluster scheme, where a large-capacity storage pool is created by data segmentation, encoding and distribution, using pre-allocated memory of nodes in storage clusters. Furthermore, in order to achieve data durability, data and its replica are respectively placed on memory and disk by employing replication-declustering mechanism. Theoretically, a clustered memory framework is constructed, both fault-tolerance mechanism and data organization strategy is investigated for clustered memory, and its reliability model is built. Technically, a set of key techniques and schemes are designed for clustered in-memory storage, including declustering-based data layout, pipelined high-performance in-memory data recovery, log-structured highly-efficient in-memory data organization, and log-segment-based memory defragmentation schemes.. This project is aimed to investigate a in-memory cluster featured with high-efficiency and high-reliability, and its prospective research results may not only deepen the memory-level fault-tolerance mechanism, but also provide valuable technical cases for the performance optimization of clustered storage.

分析发现，现有集群式存储的整体性能仍受限于磁盘等外存设备。利用高速网络和节点空闲内存构建的集群式内存能够提供高IOPS、低延迟的数据访问，有助于提升集群式存储的访问性能。针对集群式内存的内存数据容错和内存数据组织挑战，本项目提出一种基于纠删码、采用日志结构的集群式内存方案，通过数据分段、编码、布局等方式，将集群中多个节点的空闲内存构建成一个大容量内存级空间，并按副本散布机制来放置内存数据和外存副本，获得数据持久性支持。理论上，构建集群式内存存储框架，研究其数据容错机制和数据组织策略，建立集群式内存可靠性模型；方案上，研究一组关键支撑技术，包括基于副本散布的内外存数据布局、基于流水线的内存数据恢复、基于日志的内存数据组织和基于日志分段的内存碎片回收方案等。. 本项目旨在研究一种高效、可靠的集群式内存方案，其预取成果将丰富内存层数据容错研究，并为优化集群式存储提供方案借鉴和技术参考。

项目摘要

鉴于大数据处理的多样性，目前出现的多种计算模式(如，大数据查询分析计算、图计算、内存计算等)对数据存储提出一个共性要求——让数据更加接近计算。本项目结合当前高性能计算系统架构，建立了一种分布式纠删码内存系统框架，即，Proxy节点充当内存系统的应用服务器，为前台用户提供访问接口；Proxy节点、Coordinator节点和内存节点组成三方架构，支持带外通信，构建出一个大容量集群式内存系统，为前提用户提供透明的、可靠的内存访问空间。其中，Coordinator节点负责管理所有元数据信息（包括分块的分布和组织、纠删码条带的组织、分块访问信息的管理等），Proxy节点和内存节点之间提供内存级数据访问。在纠删码内存系统框架的基础上，结合考虑了数据容错性、访问倾斜性、访问局部性、负载均衡性、访问异构性等多方面因素，本项目研究了多种内存数据组织策略和管理方案，包括一种异构感知的纠删码归档方法LEAP、一种基于预取机制和平衡策略的归档优化方案PBArch、一种纠删码内存系统中智能数据放置策略WPS、一种针对通用写的混合式更新方案Hybrid-U、一种访问热度感知的冗余管理方案PaRS和一种流量感知的内存数据副本放置策略ERP/TEA。上述研究以数据编码和数据访问作为研究切入点，同时充分考虑网络、内存、外存等组件的特性，结合‘大容量内存级空间’这一需求来研究集群式内存的容错机制和数据组织策略，旨在设计一种高空间效率、高访问性能的内存级数据存储方案，为‘大容量的热点数据集’提供高可靠内存级空间，进而为大数据分析和处理提供有力的支撑。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2017

DOI：10.12054/lydk.bisu.148

发表时间：2020

DOI：10.7606/j.issn.1000-7601.2022.03.25

发表时间：2022

DOI：10.12202/j.0476-0301.2020285

发表时间：2021

DOI：10.19818/j.cnki.1671-1637.2021.05.022

发表时间：2021

黄建忠的其他基金

批准号：30970047

批准年份：2009

资助金额：8.00

项目类别：面上项目

批准号：60603074

批准年份：2006

资助金额：22.00

项目类别：青年科学基金项目

批准号：30370028

批准年份：2003

资助金额：18.00

项目类别：面上项目

相似国自然基金

面向非欧几何数据的分布式内存数据库存储方法研究

批准号：61702250

批准年份：2017

负责人：徐子晨

学科分类：F0202

资助金额：29.00

项目类别：青年科学基金项目

内存数据库容错关键技术研究

批准号：61872072

批准年份：2018

负责人：吴刚

学科分类：F0202

资助金额：63.00

项目类别：面上项目

内存集群环境下的实时数据处理

批准号：61672233

批准年份：2016

负责人：周敏奇

学科分类：F0202

资助金额：63.00

项目类别：面上项目

面向分布式迭代数据处理的高效容错机制

批准号：61902128

批准年份：2019

负责人：徐辰

学科分类：F0202

资助金额：26.00

项目类别：青年科学基金项目

面向集群式内存的容错机制和数据组织策略研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

论大数据环境对情报学发展的影响

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

多源数据驱动CNN-GRU模型的公交客流量分类预测

黄建忠的其他基金

裂殖壶菌生物合成二十二碳六烯酸新途径的研究

免疫对象存储系统（IOSS）模型、仿真和实现技术研究

海洋破囊壶菌二十二碳六烯酸生物合成相关碳链延长酶基因的克隆与表达

相似国自然基金