分布式文件系统通用化性能评测与缓存调度方法研究

基本信息
批准号:61702254
项目类别:青年科学基金项目
资助金额:23.00
负责人:顾荣
学科分类:
依托单位:南京大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:王肇康,朱光辉,李崇杰,施军,尹良良,周余发,黄志,姜茜
关键词:
分布式文件系统性能测试分布式系统大数据缓存调度优化
结项摘要

Distributed File Systems (DFS) form the foundation of distributed computing and become the cornerstone to a wide range of big data applications. Understanding and optimizing the performance of DFS are very important to the DFS users, developers and researchers. For DFS performance evaluation, existing tools mainly focus on certain testing aspects, and the coverage is limited. There lacks an extensible, easy-to-use and unified DFS performance evaluation framework. For cache policy scheduling, existing DFS can hardly adopt suitable cache policies according to the variation of the application data access patterns in run time. Therefore, this project first aims to research the key technologies on unified performance evaluation for DFS. We will study the unified abstract DFS interfaces, abstract test case models, test case designs and automatic generation, and the large-scale concurrent testing framework. With these problems solved, we build a highly scalable, easy-to-use, unified DFS performance evaluation framework. Then, to resolve existing DFS cache policies' little awareness for data access pattern variation in run time, this project will study adaptive cache policy scheduling mechanisms based on the machine learning models and sliding window technics.

分布式文件系统构成了分布式计算的基础,是如今日益发展的大数据应用的重要支撑。充分了解和优化分布式文件系统的性能对上层用户、分布式文件系统的研究者和开发者都非常重要。在性能评测方面,现有的分布式文件系统性能评测工具大都侧重于特定功能测试,覆盖面有限,缺乏一个可扩展易用的通用化性能评测框架;在缓存调度方面,现有分布式文件系统难以根据应用数据访问模式的变化合理选择缓存策略。为此,本课题将首先研究分布式文件系统通用化性能评测的关键技术方法,拟从分布式文件系统的通用化抽象接口模式、抽象评测用例模型设计、评测用例设计与自动化生成、大规模并发评测框架四个层面,着力研究解决上述问题,最终构建一个高度可扩展的、易用的通用化分布式文件系统评测框架;然后,本课题还将针对现有分布式文件系统缓存策略调度对数据访问变化感应不足,研究提出基于机器学习模型和滑动窗口技术的自适应调度方法。

项目摘要

分布式文件系统处于大数据技术栈的基础地位,在众多领域行业的大数据应用中发挥着重要作用。性能评测与优化是分布式文件系统的重要研究内容,具有较强的理论意义和应用价值。本项目中我们研究了分布式文件系统的性能评测与缓存调度优化问题:首先研究提出了一个通用的、高度可扩展的、易使用的分布式文件系统测试框架。该测试框架支持通用化抽象接口、抽象评测用例模型、评测用例内置与自动化生成,以及大规模并发评测框架;基于性能测试框架剖析性能问题后,进一步研究设计了一套面向层次化分布式文件系统的通用化缓存调度框架;最后,针对现有分布式文件系统缓存策略调度对数据访问变化感应不足的问题,研究提出基于机器学习模型和滑动窗口技术的自适应调度方法。项目中提出一些系列关键技术,从而实现了文件系统性能评测通用化、高精准与缓存加速高效化、自适应的效果。分布式缓存优化相关的成果应用于数据回放查询、分布式图计算等领域取得显著性能提升。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021
5

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019

顾荣的其他基金

相似国自然基金

1

DFS-NetEye: 基于网络度量的分布式文件系统读写调度关键技术研究

批准号:61662019
批准年份:2016
负责人:周辉
学科分类:F0204
资助金额:34.00
项目类别:地区科学基金项目
2

面向应用特征的分布式文件系统性能及建模研究

批准号:61402106
批准年份:2014
负责人:赵铁柱
学科分类:F0207
资助金额:24.00
项目类别:青年科学基金项目
3

基于能耗感知与动态性能评测的虚拟机部署方法研究

批准号:61702400
批准年份:2017
负责人:赵辉
学科分类:F0207
资助金额:25.00
项目类别:青年科学基金项目
4

机群文件系统小文件I/O访问性能优化方法研究

批准号:60973007
批准年份:2009
负责人:肖利民
学科分类:F0204
资助金额:30.00
项目类别:面上项目