基于超级计算机的大数据处理支撑平台研究

基本信息
批准号:61872392
项目类别:面上项目
资助金额:66.00
负责人:陈志广
学科分类:
依托单位:中山大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:黄志杰,刘育擘,郑馥丹,罗嘉文,李寒,瞿毅力,王莹,黎红波,胡泽杰
关键词:
大数据处理大数据处理框架超级计算机作业调度并行文件系统
结项摘要

In recent years, the complex applications consisting of both high-performance computing and big data processing phases come to emerge gradually. The platform able to support both the two computing models is on demand to support applications of this kind. Generally, the distributed cluster used to support big data processing is unable to support high-performance computing applications efficiently. Therefore, this research aims at facilitating the supercomputer designed for high-performance computing to support big data processing, thus coupling the two types of applications on the supercomputer. There exist three challenges when running big data processing jobs on supercomputer: ①the large amounts of files produced by big data processing introduce so heavy workloads that are beyond the capability of the storage system in supercomputer; ②the hybrid job scheduling taking both high-performance computing and big data processing into account confronts with unimagined challenges; ③the big data processing framework must be redesigned to adapt to the architectural characteristics of supercomputer. By considering the three challenges mentioned above, this work focuses on the research of the big data processing-oriented globally-shared storage system, the hybrid job scheduling of high-performance computing and big data processing, and the big data processing framework based on supercomputer. The technologies involved in the research will help to build a supercomputer-based platform supporting big data processing, and ultimately couple high-performance computing and big data processing on the supercomputer.

当前,一些复杂应用同时包含高性能计算和大数据处理两种计算模式,这就要求将两种计算模式统一到一套平台上。然而目前普遍用于大数据处理的分布式集群并不能有效支持高性能计算,因此,本项目试图使面向高性能计算的超级计算机支持大数据处理,从而实现两种计算模式在超级计算机上的融合。在超级计算机上实现大数据处理存在以下三大挑战:①大数据处理应用产生的海量文件将对超级计算机的全局并行文件系统形成巨大的压力;②在融合平台上实现高性能计算作业和大数据处理作业的混合调度面临严峻挑战;③在超级计算机上实现便捷高效的大数据处理还有赖于应用框架的全面革新。针对以上三大挑战,本项目分别从面向大数据处理的全局共享存储系统、高性能计算与大数据处理混合调度系统、基于超级计算机的大数据处理框架三个方面展开研究,构建基于超级计算机的大数据处理支撑平台,最终实现高性能计算与大数据处理在超级计算机上的融合。

项目摘要

高性能计算与大数据处理的融合是超算应用发展的新趋势,为此需重构超算系统软件以满足新的需求。本项目围绕超算上的大规模存储、资源管理与作业调度、大数据处理框架展开研究,促进高性能计算与大数据处理在超算上的融合。具体地,项目研发了大规模可扩展并行文件系统Kapok,同时解决了海量小文件低延迟随机访问和共享大文件高带宽并发访问问题,能够同时支持高性能计算和大数据处理负载,保证了数据存储和管理的融合。突破了物理资源和虚拟资源混合管理技术,提出了Push模式和Pull模式相结合的异构作业调度方法,实现高性能计算作业和大数据处理作业的统一调度,保证了调度上的融合。面向科学大数据的高维度有拓扑特征研发了科学大数据处理框架,针对超算的全局共享存储和处理器的NUMA结构优化了Spark系统,显著提升超算上的大数据处理效率。所研发的系统在超算中心部署使用,支撑了多领域的大量应用。项目发表论文29篇,其中1篇论文被评为中国科协第五届优秀论文,申请专利15项,其中授权11项(含PCT专利5项),登记软件著作权7件。项目成果作为重要支撑材料获得中国电子学会科技进步一等奖和“奥林帕斯”先锋奖。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
2

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
5

面向加工时间可控的柔性作业车间节能调度问题建模

面向加工时间可控的柔性作业车间节能调度问题建模

DOI:10.13196/j.cims.2019.05.004
发表时间:2019

陈志广的其他基金

相似国自然基金

1

异构计算平台下高效大图数据处理的运行时支撑环境研究

批准号:61702201
批准年份:2017
负责人:郑龙
学科分类:F0202
资助金额:26.00
项目类别:青年科学基金项目
2

超级计算机在高能物理大规模数据处理中的应用

批准号:U1932105
批准年份:2019
负责人:马秋梅
学科分类:A3201
资助金额:60.00
项目类别:联合基金项目
3

实时分布式计算机系统支撑环境(平台)研究

批准号:69273028
批准年份:1992
负责人:杨学良
学科分类:F0207
资助金额:5.00
项目类别:面上项目
4

基于Hadoop的气象云存储与数据处理平台的研究

批准号:41275116
批准年份:2012
负责人:薛胜军
学科分类:D0515
资助金额:80.00
项目类别:面上项目