面向大规模语义数据的分布式并行数据库系统的设计与实现

基本信息
批准号:61672389
项目类别:面上项目
资助金额:63.00
负责人:刘梦赤
学科分类:
依托单位:华南师范大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:陈柳,余婷,罗小敏,彭庆喜,徐晶,马杨,张剑,陈诗雅,易晨辉
关键词:
语义数据大数据存储分布式数据库并行计算
结项摘要

A major problem for the development of big data is how to analyse and manage increasingly tremendous heterogenous data with complex semantics in an efficient and effective manner. We will first design a novel semantic data model which inherently supports the frequent evolution and schema-less and schema-mix data representation, which contributes to effective data integration and data fusion. Based on this model, we will continue investigating the query and analysis language, and the data partition and distribution method by combining the graph partition and semantic information of the data. To alleviate the complexity resulting from large search space and intermediate results of analytic tasks, parallel computation model and algorithms will be designed and implemented. Based on a cluster of commodity computers, we will propose a scalable distributed and parallel architecture and build a prototype system for highly efficient parallel computing and analysis of large-scale semantic data, so as to meet various demands for comprehensive analysis and accurate queries on semantic data. The proposed work is of important theoretical value and promising application future.

如何高效的分析和管理日益剧增的大规模异质异源快速变化的复杂语义数据是大数据研究所面临的主要问题。我们将首先以复杂语义数据的表示和管理方法为切入点,探索适于表示大规模复杂语义数据的内涵、外延以及演化信息的语义数据模型,深入研究无模式数据的集成与融合,元数据的演化与管理。并为此模型设计具有推理功能的语义查询分析语言和结合图切分与语义信息的数据分割方法。同时,面临大规模语义数据的分析任务时,为了解决大量的中间结果导致的计算复杂度高查询速度慢的问题,设计与实现语义大数据的并行计算模型。继而在通用计算集群上实现适用于管理大规模语义数据的可扩展分布式和并行数据库系统,以满足对大规模语义数据的综合分析与精确查询。本课题的研究可以完善大数据环境下的语义数据管理的理论,为数据融合背景下的海量复杂多变语义数据管理与分析系统奠定基础,并为语义大数据应用的发展提供新思路和理论依据。

项目摘要

如何高效的分析和管理日益剧增的大规模异质异源快速变化的复杂语义数据是大数据研究所面临的主要问题。我们将首先以复杂语义数据的表示和管理方法为切入点,探索适于表示大规模复杂语义数据的内涵、外延以及演化信息的语义数据模型,深入研究无模式数据的集成与融合,元数据的演化与管理。并为此模型设计具有推理功能的语义查询分析语言和结合图切分与语义信息的数据分割方法。同时,面临大规模语义数据的分析任务时,为了解决大量的中间结果导致的计算复杂度高查询速度慢的问题,设计与实现语义大数据的并行计算模型。继而在通用计算集群上实现适用于管理大规模语义数据的可扩展分布式和并行数据库系统,以满足对大规模语义数据的综合分析与精确查询。本课题的研究可以完善大数据环境下的语义数据管理的理论,为数据融合背景下的海量复杂多变语义数据管理与分析系统奠定基础,并为语义大数据应用的发展提供新思路和理论依据。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

刘梦赤的其他基金

相似国自然基金

1

时态主存数据库系统的研究与实现

批准号:69483004
批准年份:1994
负责人:唐常杰
学科分类:F0214
资助金额:8.00
项目类别:专项基金项目
2

分布式并行系统大型迭代算法研究与并行实现

批准号:69373001
批准年份:1993
负责人:孙家昶
学科分类:F02
资助金额:6.00
项目类别:面上项目
3

并行数据库系统的基础研究

批准号:69373024
批准年份:1993
负责人:李建中
学科分类:F0202
资助金额:6.60
项目类别:面上项目
4

面向大规模RDF数据的分布式处理技术研究

批准号:60903010
批准年份:2009
负责人:吴刚
学科分类:F0202
资助金额:17.00
项目类别:青年科学基金项目