云计算环境下键值存储系统查询优化技术研究

基本信息

批准号：61202067

项目类别：青年科学基金项目

资助金额：22.00

负责人：吴广君

学科分类：

依托单位：中国科学院信息工程研究所

批准年份：2012

结题年份：2015

起止时间：2013-01-01 - 2015-12-31

项目状态：已结题

项目参与者：李超,陈明,李斌斌,王海平,安丰春,周晓阳,温月蓉,孙智,刘广予

关键词：

索引技术查询规划键值存储系统云计算NoSQL数据库

结项摘要

Big Data, big traffic and high concurrency are the main feathers in the Cloud Computing. Distributed KEY-VALUE storage system has been becoming the alternatives of traditional relational DB for massive structure data in Cloud Storage. The project solves query capability and query efficiency problems under Cloud Computing background for KEY-VALUE storage system. The research includes three parts: the global optimal query path selection mechanism for Cloud Computing; working-load aware multi-layer cache structure design; and efficient I/O method for indexing management in KEY-VALUE storage system. It is the goals for this project to build an on-line storage and analysis platform for massive structure data in Cloud Computing.

大数据、大流量、高并发是云计算的主要应用特征。分布式键值存储系统已经逐步取代传统关系型数据库，作为海量结构化数据的云存储平台。课题解决键值存储系统在云计算环境中查询多样性差、查询效率低的问题。研究内容包括面向云环境的全局最优查询计划选择机制；基于工作流感知的动态多层缓存结构设计；以及面向键值存储系统的高效索引数据存取、组织技术等，课题研究目标是建立面向云计算的海量结构化数据在线的实时存储、分析平台。

项目摘要

课题针对键值存储系统在云计算环境下所面临的查询多样性差、查询效率低等问题，以高吞吐率、低查询延迟的复杂云应用为研究背景，深入研究云计算环境下的查询优化技术。.课题把云计算中复杂的云应用概括为两大类：面向离线海量结构化数据管理与分析应用、面向流式大数据实时数据处理与分析应用。首先，课题针对离线大数据研究结构化数据分布式存储组织架构、研究面向主从模式的数据分区组织技术、研究基于SSD的索引分级组织与管理技术等，通过上述技术有效加速离线大数据精确查询计算效率，为复杂OLAP分析类业务提供加速基础。其次，课题针对在线流式大数据研究面向column-family模型的多维大数据聚合查询加速技术、研究基于聚类的有限误差直方图构建技术与误差估算方法、研究满足多查询模式一体化概要数据在线构建与维护技术等，结合相关估算理论与误差分析方法，课题所提出的方法可以为流式大数据提供高计算精度、低查询延迟的实时流数据处理与查询方法。.课题组设计并实现相关算法、数据结构，开发了分布式环境下的原型系统，并在百亿记录真实数据集背景与典型的大数据处理与分析系统进行比较。课题提出的离线数据分析方法，在百亿记录规模下比基于Hadoop的大数据分析系统（如Hive）提高4个数量级的查询效率；课题所提出的流式大数据处理与分析方法与基于内存计算的大数据分析系统相比（如Spark），提高两个数量级的查询效率。同时课题所提出的方法在系统吞吐率、查询延迟、存储效率等方面均具有明显的性能提升。.课题组发表6篇学术论文，申请4项国家发明专利，培养博士生2人，硕士生3人。课题财务支出符合国家规定，圆满完成申请书中的各项任务指标。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.1360/SSM-2020-0035

发表时间：2020

吴广君的其他基金

相似国自然基金

云计算环境下医学RDF大数据的分布式查询处理与优化技术研究

批准号：61363018

批准年份：2013

负责人：杜方

学科分类：F0202

资助金额：45.00

项目类别：地区科学基金项目

云环境下社交空间关键字查询处理与优化技术研究

批准号：61672145

批准年份：2016

负责人：赵相国

学科分类：F0202

资助金额：63.00

项目类别：面上项目

键值存储系统架构设计与性能优化研究

批准号：61772484

批准年份：2017

负责人：李永坤

学科分类：F0204

资助金额：64.00

项目类别：面上项目

云环境下大规模动态图数据查询处理与优化技术研究

批准号：61472169

批准年份：2014

负责人：宋宝燕

学科分类：F0202

资助金额：82.00

项目类别：面上项目

云计算环境下键值存储系统查询优化技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

新型树启发式搜索算法的机器人路径规划

"多对多"模式下GEO卫星在轨加注任务规划

智能煤矿建设路线与工程实践

现代优化理论与应用

吴广君的其他基金

相似国自然基金