面向用户数据存储的云文件系统关键技术研究

基本信息
批准号:61073165
项目类别:面上项目
资助金额:36.00
负责人:杨广文
学科分类:
依托单位:清华大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:刘力,刘立坤,刘松彬,李锐喆,邹茗,张扬
关键词:
云文件系统云存储负载平衡可扩展性数据消重
结项摘要

用户数据存储转向云平台已成为一种不可逆转的趋势,然而,现有的分布式文件系统面对这类特殊的应用时,在可扩展性和存储利用率等方面尚存在诸多不足。为了解决上述问题,本课题将重点研究面向用户数据的云存储这类特殊应用的云文件系统。针对这类应用中用户多、访问并发度高、数据量大、数据热点明显的特点,解决分布式文件系统中可扩展性(特别是存储容量和元数据),重复数据消重,数据热点侦测以及面向工作负载的数据放置和自适应负载平衡机制等技术问题;研制高效、易于扩展和管理的面向用户数据在线存储的云文件系统,并利用清华大学已经部署和使用的数据共享平台Corsair进行验证优化。通过上述工作,切切实实推动云存储模式在国内的推广,降低用户数据的存储成本和维护代价,同时提高数据的可用性,使用户切切实实地感受到云存储带来好处;同时为具备条件的企业快速构建自己的云存储平台提供支持。

项目摘要

用户数据存储转向云平台已成为一种不可逆转的趋势,然而,现有的分布式文件系统面对这类特殊的应用时,在可扩展性和存储利用率等方面尚存在诸多不足。为了解决上述不足,本课题面向用户数据的云存储这类特殊的应用,针对这类应用中用户多、访问并发度高、数据量大、数据热点明显的特点,探究了分布式文件系统的可扩展性(特别是存储容量和元数据)、重复数据删除、面向工作负载的数据放置和自适应负载平衡机制等技术问题,主要工作和成果包括:.1. 海量文件系统元数据查询的方法和技术:1) 针对以企业级文件服务器、附网存储设备和部分采用分布式元数据存储的高性能文件系统为代表的典型应用场景, 提出了基于选择性扫描(SmartScan)的元数据快速抓取和同步方法,较好地解决了元数据抓取和同步的效率问题。2) 针对部分存储管理任务对元数据副本和查询结果的 “足够新”的需求,提出了基于文件系统注入的元数据变化跟踪方法。.2. 提出了一种基于键值key-value存储的分布式文件系统元数据管理方法,既保证了高效的元数据访问,又为元数据的修改提供了灵活的接口,能够保证元数据的一致性。.3. 针对虚拟计算环境中的MapReduce负载,提出了一种数据位置感知的优化方法,能够将同一文件块的多个副本均匀分配到不同的物理机中,从根本上减少I/O相互干扰所引起的应用性能急剧下降。.4. 针对虚拟机镜像存储,提出了一种基于重复数据删除技术的存储方法,同时结合P2P技术和按需传输的思想,在节省存储空间的同时,能够有效降低网络负载、加快镜像文件的分发速度。.5. 通过精简元数据信息、改进缺省的数据分布策略等方式,解决了pNFS分布式文件系统在处理海量小文件时性能不足的问题。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

资本品减税对僵尸企业出清的影响——基于东北地区增值税转型的自然实验

资本品减税对僵尸企业出清的影响——基于东北地区增值税转型的自然实验

DOI:10.14116/j.nkes.2021.03.003
发表时间:2021
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

杨广文的其他基金

批准号:60173007
批准年份:2001
资助金额:18.00
项目类别:面上项目
批准号:60573110
批准年份:2005
资助金额:25.00
项目类别:面上项目
批准号:61672312
批准年份:2016
资助金额:64.00
项目类别:面上项目
批准号:60373005
批准年份:2003
资助金额:23.00
项目类别:面上项目

相似国自然基金

1

移动云存储中面向多用户共享的数据安全技术研究

批准号:61572080
批准年份:2015
负责人:黄勤龙
学科分类:F0206
资助金额:64.00
项目类别:面上项目
2

云存储数据安全验证的关键技术研究

批准号:61103205
批准年份:2011
负责人:钟婷
学科分类:F0206
资助金额:23.00
项目类别:青年科学基金项目
3

云环境下数据存储安全关键技术研究

批准号:61702402
批准年份:2017
负责人:姜涛
学科分类:F0206
资助金额:25.00
项目类别:青年科学基金项目
4

云存储中数据泄漏的主动防护关键技术研究

批准号:61303191
批准年份:2013
负责人:马俊
学科分类:F0214
资助金额:23.00
项目类别:青年科学基金项目