多源相关数据隐私保护的不确定性理论和方法研究

基本信息
批准号:61672176
项目类别:面上项目
资助金额:63.00
负责人:李先贤
学科分类:
依托单位:广西师范大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:张继连,蒋静,刘鹏,王利娥,钟胜海,陈刘华,王焕杰,王如希,邓超记
关键词:
多源数据数据安全数据管理隐私保护
结项摘要

Integrated analysis of multi-source data is an important aspect in the area of big data applications. The concern of privacy information leakage has become a primary negative factor for the wide and deep application of big data since there is massive sensitive information contained in these datasets. The heterogeneity, correlation and dynamicity of multi-source data has brought about more complex and changeable patterns of privacy information leakage, which raises multiple aspects of theoretical and technical challenges on the suitability of privacy model, the effectuality of privacy-preserving method and the complexity of privacy-processing algorithm. The project will study on the privacy-protection theories and technologies in multi-source data integration and analysis. It focuses on the key scientific and technological problems including the uncertainty feature characterization of correlation between the privacy and credibility of the privacy-processed multi-source data, and the computational complexity of privacy-processing algorithms caused by the heterogeneity and dynamicity of multi-source data. It will calculate the privacy uncertainty by combing both the Probabilistic Graphical Model and the semantic Differential Privacy, and proposes privacy-protection methods for multi-source correlated data integration based on the local and fine-grained mechanisms of privacy uncertainty processing, to address the collisions between the privacy and utility of data, and the computational complexity of privacy-processing. Furthermore, it will develop the privacy-processing prototype system to evaluate the performance and efficiency of the research results based on the real datasets, and promotes the practical applications of the research results in the project.

多源数据集成分析是大数据应用的重要问题之一,由于数据集包含了大量敏感隐私信息,隐私信息泄露问题成为阻碍数据集成分析广泛应用的一个关键性因素。多源数据的异构、相关性和动态性等特征导致了隐私信息泄露模式更为复杂多变,对现有数据隐私模型的适用性、隐私保护方法的效用性和隐私处理算法的复杂性等提出了多方面理论和技术挑战。项目针对多源相关数据集成分析的隐私性保护开展研究,着重研究解决多源相关数据隐私处理的隐私性与可信性关系的不确定性特征刻画,异构、动态性所带来的隐私处理算法计算复杂性等关键科学技术问题,拟采用基于概率图模型和差分隐私语义相结合的隐私不确定性特征计算技术思路,提出局部细粒度不确定性扰动的隐私处理机制,解决数据隐私性与效用性冲突,以及面向大数据隐私处理算法的高度计算复杂性难题,并基于实际应用数据集,研制原型系统评估方法的有效性,促进成果实际应用。

项目摘要

在人工智能、推荐系统、物联网和区块链等多个应用领域,需要聚合或集成多源性数据资源进行分析,以提高智能系统的精准度和普适性,这需要这些数据跨域共享或流动,但这些数据往往包含了大量个人隐私信息,例如医疗数据、电子商务数据、社交网络数据和位置服务数据等,因此,如何在应用这些数据的同时保护敏感信息成为一个重要研究问题。由于这些多源数据具有多样性、异构型和复杂关联性等特征,数据的隐私处理面临安全性与效用性冲突、可靠性与处理效率冲突等难点问题,其核心科学问题是数据不确定性与数据相关性处理的复杂性。本项目针对多源数据聚合的隐私保护技术开展研究,取得的主要研究结果包括:(1)针对区块链、物联网、云边协同和众包智能计算等新型分布式应用环境,提出高效的多源数据流动安全机制和隐私保护方法,并研制应用系统;(2)针对人工智能的数据安全问题,提出分布式机器学习方法相融合的多源数据隐私处理机制和算法,解决数据学习算法效率、精准性和安全性的难点问题。(3)提出基于局部不确定性与关联性融合模型的多样性数据发布的精准隐私保护模型和方法;(4)提出基于知识图谱和精准扰动的位置和轨迹数据发布隐私处理算法和机制,实现隐私信息精准控制,解决过保护引起数据价值损失问题。理论创新成果包括学术论文24篇,其中SCI国际期刊17篇(中科院二区或CCF推荐B类以上期刊15篇),顶级国际会议1篇,CCF推荐A类中文期刊2篇。并且,结合物联网安全管理平台和数据交易平台,成果已经应用于开发实际应用系统,部署在一些重要企业验证了成果的实用性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

李先贤的其他基金

相似国自然基金

1

数据流发布中的隐私保护理论和方法研究

批准号:61502111
批准年份:2015
负责人:王金艳
学科分类:F0205
资助金额:20.00
项目类别:青年科学基金项目
2

多源数据机器学习中的隐私保护技术研究

批准号:61902290
批准年份:2019
负责人:马鑫迪
学科分类:F0205
资助金额:30.00
项目类别:青年科学基金项目
3

大数据发布隐私保护中的不确定性问题及其方法研究

批准号:61762059
批准年份:2017
负责人:晏燕
学科分类:F0205
资助金额:36.00
项目类别:地区科学基金项目
4

多源数据融合场景下的对抗式隐私洞察靶向保护技术研究

批准号:61902226
批准年份:2019
负责人:周志刚
学科分类:F0206
资助金额:26.00
项目类别:青年科学基金项目