数据隐藏发布中聚类可用性的维持在高维及数据动态更新环境下尤为困难:1).聚类对数据个体差异的依赖与隐藏操作弱化个体差异的主要思想存在截然矛盾;2)"维数灾难"导致常用的匿名与随机化隐藏方法失效;3)面向聚类的重发布隐藏中数据聚簇关系可获取为"轨迹跟踪"攻击提供了便利。本课题针对上述问题:1)引入聚类信息核对数据聚类可用性建模,并构建面向聚类的隐私模型;2) 提出数据集内涵与外延概念,构建关于聚类的数值属性类别层次,实现低维数据匿名隐藏中聚类信息核保存;3)借助信息熵概念对数据空间进行划分,借鉴"势能场"理论构建子空间数据对象"等势面"模型,设计启发式扰动策略实现高维数据隐藏中聚类信息核保存;4)提出重发布影响集和边缘记录集概念,对更新后数据进行分类隐藏,避免"轨迹跟踪"导致的隐私泄露。弥补现有研究数据隐藏后难以满足深层应用需求,及对数据集静态、常规维度限制与现实世界复杂数据环境脱节的不足。
数据隐藏发布中聚类可用性的维持在高维及数据动态更新环境下尤为困难:(1) 聚类对数据个体差异的依赖与隐藏操作弱化个体差异的主要思想存在截然矛盾;(2) “维数灾难"导致常用的匿名与随机化隐藏方法失效;(3) 面向聚类的重发布隐藏中数据聚簇关系可获取为“轨迹跟踪”攻击提供了便利。项目组针对上述问题开展了以下研究:(1) 从k邻域对象集这一粒度介于数据分布与数据距离间的"微分布结构"角度定义聚类信息核,提出保邻域隐藏思想,并构建面向聚类的隐私模型;(2) 分析数据对象k邻域结构成因,构建遗传算法与隐藏操作间的映射机制、隐藏操作与空间向量运算间的关联机制,设计基于遗传算法和向量偏转等技术的隐私保护数据发布方法,提出面向聚类的微数据隐藏发布解决方案;(3) 从信息熵角度分析各属性对维持聚类信息核所起的作用,设计隐藏策略,提出面向聚类的高维数据隐藏发布方法;进一步采取分治策略,利用阿基米德螺线和对数螺线旋转特性提出适应高维数据、能更好地兼顾数据聚类可用性与隐私安全性的数据隐藏方案;(4) 在所提出基于螺线旋转数据隐藏方法基础上,通过构建面向动态数据集的隐私泄露风险模型,利用阈值控制和延时发布策略,提出数据动态更新环境下兼顾聚类可用性与隐私安全性的增量式数据隐藏方案。本项目主要关注以数据为中心的复杂约束环境下静态数据隐藏发布问题,在完成项目预期研究工作基础上,项目组对已取得研究成果在以服务为中心的隐私保护位置服务中的应用进行探索,作为项目研究的外延,提出基于Hilbert编码及位置扰动隐藏的保护位置隐私近邻查询解决方案。
{{i.achievement_title}}
数据更新时间:2023-05-31
EBPR工艺运行效果的主要影响因素及研究现状
基于铁路客流分配的旅客列车开行方案调整方法
一种基于多层设计空间缩减策略的近似高维优化方法
基于限流级差配合的城市配电网高选择性继电保护方案
智能煤矿建设路线与工程实践
高维稀疏数据聚类研究
基于约束的高维数据聚类
聚类导向的字典学习及基于稀疏表示的高维数据聚类研究
面向高维数据集成降维的半监督聚类方法研究