Due to extremely slow speed, the majority of existing privacy protection mechanisms are difficult to be applied in the big data environment where data are distributed storage and processing operations are complex. To address the problem of data content leakage in the process of big data, this project researches on efficient and privacy-preserving big data processing methods. On the one hand, according to the characteristic of algorithms’ diversity for data analysis in the big data environment, we start from the common basic operation. Specifically, based on lightweight multi-party random masking and polynomial aggregation techniques, we construct fast secure multi-party computation schemes for specific operations, and lay more emphasis on designing efficient and privacy-preserving basic computing algorithms. In addition, we achieve privacy protection of data assets through constructing privacy protection mechanisms with composable security. On the other hand, considering the requirements of calculation and ordering in big data query service, and from the structure of the ciphertext retrieval secure index, we construct security index algorithms which support homomorphism refactoring and sorting. Moreover, we lay more emphasis on the field of computable query over ciphertext to realize privacy protection of big data content and users' information in real time during the query analysis calculation. This project pays much attention to the portability of research, the exploratory of theory, the perspectiveness of technique and the validity of application, and it can provide systematic design theory and analysis techniques for data privacy protection during the process of big data.
传统隐私保护机制大多速度慢难以应用于数据分布存储且处理运算复杂的大数据环境。本项目针对大数据处理过程中的数据内容泄露问题,研究高效的隐私保护方法。一方面,针对大数据环境下数据分析算法的多样性特点,融合多项式聚合和随机扰乱等技术,设计面向余弦相似度、欧氏距离等共性基础运算的快速安全多方计算方法,并构建多算法组合安全的隐私保护机制,实现复杂数据挖掘过程中对数据的隐私保护;另一方面,充分考虑大数据查询服务的计算和排序需求,从同态加密算法的安全陷门构造出发,设计支持同态重构与排序的安全索引方法,着重研究高效密文查询计算方案,实现数据查询分析过程中对大数据内容和用户信息的实时隐私保护。该项目注重研究的可移植性、理论的探索性、技术的前瞻性及应用的有效性,为大数据处理过程中数据的隐私保护提供系统的设计理论和分析技术。
近年来,随着大数据时代的到来,用户隐私数据泄露事件频发。同时,我国《网络安全法》、《信息安全技术个人信息安全规范》、欧盟《通用数据保护条例》等相继颁发的法律法规,极大地促进了人们对隐私的关注,用户在使用大数据相关技术的同时,越来越重视隐私保护。为此,本项目面向大数据系统中的隐私泄露问题进入如下研究。1. 大数据安全协同计算方法;2. 密文数据高效查询算法;3. 数据系统安全架构;4. 数据安全可信传输。在大数据安全协同计算方法方面,针对数值比较,子集聚合等计算设计了安全两方/多方协同计算协议,构造了隐私保护的分布式skyline计算、众包任务分配等方案;在密文数据高效查询方面,将随机扰乱、同态加密等隐私保护技术与数据结构相结合,设计了安全高效的空间查询、相似度查询、机器学习分类查询等算法,并面向基于位置服务、生物特征识别、在线医疗等典型互联网服务构造了系列高效隐私保护方案;在数据系统安全架构方面,针对生物特征识别系统以及SDN网络系统中存在的安全隐患,分别提出了面向声纹识别系统的欺骗攻击和面向SDN网络的网络收割攻击及其防御方法。同时,提出了数据系统信息传播模型,对信息传播失真度与传播次数的关系进行了分析与量化;在数据安全可信传输方面,面向多媒体视频传输网络以及卫星网络,设计了系列数据安全传输与认证协议,实现了数据安全可信传输。本项目的研究内容可为大数据相关技术在交通、医疗、金融等领域的应用提供安全理论和技术支撑。此外,本项目的相关成果在百度、海信、陕西航信、大象慧云、西交一附院等企业或组织进行了部署了与应用,在用户隐私保护方面取得了显著效果。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
云计算环境下数据库查询验证及数据隐私保护研究
大数据环境下的数据查询隐私保护技术研究
面向隐私保护的大数据查询处理方法研究
海量数据查询中的双向隐私保护机制研究