图模型大数据的分布式查询处理关键技术研究

基本信息
批准号:61572353
项目类别:面上项目
资助金额:67.00
负责人:王鑫
学科分类:
依托单位:天津大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:王军虎,李元放,杨雅君,金弟,王昌龙,吕雪栋,付宇新,李致远,吕小玲
关键词:
图数据库分布式部分求值大数据查询处理
结项摘要

As graph-modeled big data are widely used in various fields, the demand for highly efficient graph query processing is urgently called for. Since the inherent nature of the high computational complexity of graph queries, traditional methods are generally unable to cope with query processing tasks on big graph data. In this project, we propose to take “divide and conquer” and “trade space for time” scientific thoughts as strategies, doing the research on key technologies of distributed query processing oriented to graph-modeled big data. We will propose the partition, storage, and indexing schemes for big graph data in the distributed environment; propose distributed graph query processing algorithms for conjunctive query, regular path query, CRPQ query, and ECRPQ query based on the “partial evaluation” approach, which will use parallelized “divide and conquer + collaboration ” strategy and graph structural indexing based “holistic matching” strategy to realise the fast evaluation of distributed graph queries; propose the distributed graph query optimization cost model, based on which we study the distributed graph query optimization scheme that consists of the optimization of join order, runtime optimization, and approximate query and ranking; design the benchmark for distributed graph query, based on which we conduct extensive experimental evaluation for the propsosed methods. In this project, we will develop a graph database prototype system that will be equipped with the highly efficient distributed graph query capability for graph-modeled big data.

图模型大数据在各领域的广泛应用对高效率图查询处理提出迫切需求。由于图查询固有的高计算复杂度特性,传统方法普遍无法应对大图数据上的查询处理任务。本项目提出以“分而治之”和“空间换时间”的科学思想为策略,研究面向图模型大数据的分布式查询处理关键技术。具体包括:提出分布式环境下大图数据的划分、存储与索引方案;基于“部分求值”方法,提出合取查询、正则路径查询、CRPQ查询和ECRPQ查询的分布式图查询处理算法,利用并行化的“分治+协同”策略和基于图结构索引的“整体匹配”策略,实现分布式图查询的快速求值;提出分布式图查询优化代价模型,研究包括连接顺序优化、运行时优化和近似查询与排序在内的一揽子分布式图查询优化方案;设计分布式图查询评测基准,对所提方法进行全面的实验验证。本项目将开发面向图模型大数据的具备高效率分布式图查询功能的图数据库原型系统。

项目摘要

图模型大数据在各领域的广泛应用对高效率图查询处理提出迫切需求。由于图查询固有的高计算复杂度特性,传统方法普遍无法应对大图数据上的查询处理任务。本项目提出以“分而治之”和“空间换时间”的科学思想为策略,研究面向图模型大数据的分布式查询处理关键技术。.项目主要研究内容主要包括:(1) 图模型大数据的划分与存储:研究综合考虑属性图和RDF图的本质特征,定义分布式图模型,制定划分策略的最优化度量指标,提出高效的图数据分布式压缩存储方案。(2) 分布式图查询处理算法:研究分布式CQ查询处理算法、RPQ查询处理算法、CRPQ查询处理算法和ECRPQ查询处理算法。(3) 分布式图查询优化方案:研究分布式图查询处理的代价模型、最优连接顺序、运行时优化技术和近似查询方法。(4) 实验验证与原型系统:开发原型系统实现图模型大数据上的分布式查询处理方案,设计实验验证所设计算法和方案的性能效果。.项目所取得的重要成果主要包括:(1) 在图模型大数据的划分与存储方面:设计并实现了一种高效率的分布式图着色算法用于分布式图划分的重要步骤,提出了一种语义感知的RDF图划分方法,开发了本体感知的RDF图分布式存储方案,实现了RDF图和属性图的统一存储方案,实现了基于SSD存储的键值存储库底层压缩方法。(2) 在分布式图查询处理方面:提出了分布式图查询处理算法PDSM和StarMR用于高效执行大规模RDF图上的子图匹配查询,实现了基于部分求值策略的正则路径查询处理算法,同时提出了动态图上的最近邻和最短路径查询算法。(3) 在分布式图查询优化方面:提出基于代价模型的分布式正则路径查询优化方案用于减少中间结果和通信开销,开发了基于生成树的分布式子图匹配查询优化方案SP-Tree用于减少中间结果和消息传递。(4) 在实验验证与原型系统方面:开发了图模型大数据分布式存储与查询原型系统,实现了多种可视化交互式图查询语言和工具。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
4

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
5

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021

王鑫的其他基金

批准号:61603124
批准年份:2016
资助金额:18.00
项目类别:青年科学基金项目
批准号:81904277
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:31700812
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:41775144
批准年份:2017
资助金额:75.00
项目类别:面上项目
批准号:41672158
批准年份:2016
资助金额:70.00
项目类别:面上项目
批准号:40505007
批准年份:2005
资助金额:30.00
项目类别:青年科学基金项目
批准号:61473228
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:21876090
批准年份:2018
资助金额:66.00
项目类别:面上项目
批准号:11105119
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:31602058
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:81470092
批准年份:2014
资助金额:30.00
项目类别:面上项目
批准号:31700755
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:10804100
批准年份:2008
资助金额:17.00
项目类别:青年科学基金项目
批准号:11603031
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:81301673
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:61703148
批准年份:2017
资助金额:26.00
项目类别:青年科学基金项目
批准号:61100049
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:51906061
批准年份:2019
资助金额:23.00
项目类别:青年科学基金项目
批准号:81400443
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:61374019
批准年份:2013
资助金额:79.00
项目类别:面上项目
批准号:51504146
批准年份:2015
资助金额:22.00
项目类别:青年科学基金项目
批准号:31100101
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:51008198
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:51103109
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:61705143
批准年份:2017
资助金额:23.00
项目类别:青年科学基金项目
批准号:61805286
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:51376197
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:41402301
批准年份:2014
资助金额:12.00
项目类别:青年科学基金项目
批准号:31500315
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:41876021
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:11705290
批准年份:2017
资助金额:23.00
项目类别:青年科学基金项目
批准号:41302144
批准年份:2013
资助金额:28.00
项目类别:青年科学基金项目
批准号:81500255
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:51809130
批准年份:2018
资助金额:22.00
项目类别:青年科学基金项目
批准号:61602057
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:51503001
批准年份:2015
资助金额:22.00
项目类别:青年科学基金项目
批准号:61074194
批准年份:2010
资助金额:32.00
项目类别:面上项目
批准号:40772006
批准年份:2007
资助金额:42.00
项目类别:面上项目
批准号:40906010
批准年份:2009
资助金额:19.00
项目类别:青年科学基金项目
批准号:41105110
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:31760080
批准年份:2017
资助金额:38.00
项目类别:地区科学基金项目
批准号:61303142
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:50806083
批准年份:2008
资助金额:21.00
项目类别:青年科学基金项目
批准号:11804113
批准年份:2018
资助金额:28.00
项目类别:青年科学基金项目
批准号:81702890
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:81802384
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:81601757
批准年份:2016
资助金额:18.00
项目类别:青年科学基金项目
批准号:21107053
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:81571176
批准年份:2015
资助金额:57.00
项目类别:面上项目
批准号:21604081
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:81500723
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:51909165
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:51608030
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:61903310
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:31871077
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:41902218
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:31902216
批准年份:2019
资助金额:24.00
项目类别:青年科学基金项目
批准号:41376025
批准年份:2013
资助金额:81.00
项目类别:面上项目
批准号:11805017
批准年份:2018
资助金额:23.00
项目类别:青年科学基金项目
批准号:61873210
批准年份:2018
资助金额:63.00
项目类别:面上项目
批准号:21577068
批准年份:2015
资助金额:70.00
项目类别:面上项目

相似国自然基金

1

基于分布式计算框架的大图数据描述性查询关键技术研究

批准号:61272156
批准年份:2012
负责人:高军
学科分类:F0202
资助金额:82.00
项目类别:面上项目
2

关联数据上基于图的分布式查询处理技术研究

批准号:61702171
批准年份:2017
负责人:彭鹏
学科分类:F0202
资助金额:20.00
项目类别:青年科学基金项目
3

分布式不确定数据查询处理关键技术研究

批准号:61472425
批准年份:2014
负责人:覃飙
学科分类:F0202
资助金额:80.00
项目类别:面上项目
4

瞬态云环境下的自适应大图迭代查询处理关键技术研究

批准号:61902366
批准年份:2019
负责人:王志刚
学科分类:F0202
资助金额:27.00
项目类别:青年科学基金项目