不确定性关系数据的溯源方法研究

基本信息
批准号:61202033
项目类别:青年科学基金项目
资助金额:24.00
负责人:王黎维
学科分类:
依托单位:武汉大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:范昊,王梁,李文凤,欧伟杰,付祖发,李佳瑾,李晓梅,张厚望,葛贺飞
关键词:
溯源查询溯源存储关系数据不确定性溯源表达
结项摘要

Uncertainty occurs during the process of data collecting, transmitting and converting, however, since many scientific applications and large-scale data managements usually require processing and integrating a large number of data from different sources, uncertainty in the data makes the credibility of these integrated results to be questioned. Supporting provenance on uncertain data to query data sources and processing steps can help users understand the credibility of the results. The aim of this project is to achieve provenance management on uncertain relational data, which focus to establish provenance model for the uncertain relational data and investigate provenance representation, acquisition, storage, retrieval and visualization on uncertain relational data. Considering uncertainty both at the attribute level and at tuple level, we adopt multi-granularity representation of the provenance to improve its flexibility. We propose the tuple-level provenance compression and storage method, and explore the table-level provenance storage and method to convert provenance from table-level to tuple-level. We also investigate credibility computation based on the provenance and tuple dependence, and try to apply some sorts of optimal technology to reduce the computational complexity. Finally, we design provenance visualization solution and build the visualization platform of provenance management.

数据在采集、传输、转换的过程中都会导致不确定性数据的产生。然而,许多科学应用和大规模数据管理通常需要集成和处理大量的不同来源的数据,数据的不确定性使得这些集成结果的可信度受到质疑。支持不确定性数据的溯源,提供对数据来源及处理步骤有效方便的查询支持可以帮助用户理解结果的可信度。本项目以实现不确定性关系数据的溯源管理为目标,着眼于建立不确定性关系数据的溯源模型,研究不确定性溯源信息的表达、获取、存储、查询和可视化。考虑数据的属性级和元组级不确定性,采用溯源信息的多粒度表达方法,提高其表达的灵活性;提出元组级溯源信息的压缩存储方法,并探索表级溯源信息存储以及转换为元组级溯源信息的高效方法;研究基于溯源信息及元组依赖性的结果可信度计算方法,并探索各种优化方法降低计算的复杂度;最终设计溯源信息可视化方案并构建溯源信息管理的可视化平台。

项目摘要

本项目以带有溯源信息的不确定数据管理为目标,从建模、存储、查询、概率计算和可视化几个方面入手,研究支持多粒度的不确定性关系数据的溯源建模与表达;不确定性关系溯源信息的获取和存储方法;基于溯源信息及元组依赖性的高效的可信度计算方法;研究溯源信息可视化技术并构建不确定性关系数据的溯源信息系统。针对以上研究内容,本项目提出属性表达式,并利用属性表达式构建溯源表达式,设计基于对象代理模型的带有溯源信息的不确定性数据存储模型,并提出不确定数据概率值评估方法和结果元组概率值计算方法,从不确定元组相互独立和相互依赖两个方面考虑如何进行结果概率值计算,并进一步研究基于属性值约简的概率值计算方法和不确定数据的top-k查询方法。最终设计溯源信息可视化方案并构建溯源信息管理系统。项目期间,在国内外重要期刊和会议上发表了6篇论文、申请了1个软件著作权。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

王黎维的其他基金

相似国自然基金

1

虚拟机不确定错误的溯源方法研究

批准号:61402451
批准年份:2014
负责人:于佳耕
学科分类:F0202
资助金额:24.00
项目类别:青年科学基金项目
2

基于溯源的高效智能的入侵检测与数据重建方法研究

批准号:61402189
批准年份:2014
负责人:谢雨来
学科分类:F0204
资助金额:24.00
项目类别:青年科学基金项目
3

无线传感器网络中虚假数据过滤和溯源追踪方法研究

批准号:61363077
批准年份:2013
负责人:章志明
学科分类:F0208
资助金额:43.00
项目类别:地区科学基金项目
4

事件驱动采样长路径多源数据的快速跟踪与溯源方法研究

批准号:61273002
批准年份:2012
负责人:金学波
学科分类:F0303
资助金额:61.00
项目类别:面上项目