How to protect data privacy as well as to perform accurate data analysis on large scale, heterogeneous social network has become one of the most important cutting edge research issues in the domain of data mining and privacy protection. The key difficulties of this research issue lie in: how to automatically discover the complex embedded correlation among graph data of multi-relations and multi-attributes. Then, how to design correlation-aware differential privacy protection approach,and eventually to guarantee the high utility of published.graph data while satisfying privacy protection concerns. According to this scientific problem, we proposed the following research contents: (1) propose the semi-supervised clustering method based multi-view intact space learning algorithm, which is used to solve the problem that how to adaptively identify correlated multi-relations; (2) propose the Markov logic net based inferring learning algorithm, which is used to automatically infer the correlated multi-attributes; (3) propose the (θ,r)-bound algorithm and path based SKG graph model, which is respectively used to solve node privacy protection and edge privacy protection of heterogeneous social network; (4) propose the interactive.differential privacy protection method, which is eventually used to solve the issue when given non-zero knowledge and correlated data set, how to protect the privacy of large-scale heterogeneous social network, i.e., the private data publishing.
如何在隐私保护的前提下,对大规模的、数据耦合关系复杂的异构社交网络数据进行高效用的统计分析已经成为数据挖掘和隐私保护领域中的重要前沿交叉课题。这个课题的关键研究难点是:如何在异构社交网络图特征空间中自动识别出多关系、多属性耦合相关关系,并设计出一个耦合感知的差分隐私保护方法,从而在满足隐私保护的前提下确保大规模异构社交网络隐私数据发布的高可用性。本课题围绕这个科学问题,提出了以下研究内容:(1)基于多视图完整空间半监督聚类学习的多关系耦合识别算法,用于解决多关系耦合的自适应识别问题;(2)基于马尔科夫逻辑网的推理学习算法,用于解决多属性耦合的推理识别问题;(3)基于图限定度(θ,r)-bound的保护算法,和基于路径相关的随机Kronecker图模型算法,分别用于解决异构社交网络节点及边的隐私保护问题;(4)基于交互式的差分隐私保护方法,用于解决大规模、累积相关查询结果敏感的隐私保护问题。
如何在隐私保护的前提下,对大规模的、数据耦合关系复杂的异构社交网络数据进行高效用的统计分析已经成为数据挖掘和隐私保护领域中的重要前沿交叉课题。这个课题的关键研究难点是:如何在异构社交网络图特征空间中自动识别出多关系、多属性耦合相关关系,并设计出一个耦合感知的差分隐私保护方法,从而在满足隐私保护的前提下确保大规模异构社交网络隐私数据发布的高可用性。. 本课题围绕这个科学问题,提出了以下研究内容: 基于半监督聚类树的多关系耦合识别算法,用于解决多关系耦合的自适应识别问题; 面向异构稀疏社交网络的表示学习方法,并在此基础上解决隐私保护问题;基于组间组内用户耦合的差分隐私保护方法用以解决异构社交网络节点及边的隐私保护问题。围绕上述研究内容,课题组分别提出基于本地差分隐私保护技术的一系列方法,在公开数据集如Facebook数据集和Enron上,取得较好效果。随后课题组还将现有研究成果延展至隐私数据发布问题上。课题组系列成果证明前期研究思路可行性,所取得成果具有较好的学术价值和应用前景。课题组相关学术结果已发表为期刊会议论文18篇,SCI 收录8篇,EI 收录10篇,其中包括中国计算机协会推荐A类期刊会议3篇、B类期刊4 篇、C类期刊会议2篇。课题组培养硕士、博士生共约十余人,获批一项专利,在申专利两项。通过本课题研究,课题组在大规模异构社交网络隐私保护保护问题上,已经取得了一定的国际学术认可。
{{i.achievement_title}}
数据更新时间:2023-05-31
EBPR工艺运行效果的主要影响因素及研究现状
基于铁路客流分配的旅客列车开行方案调整方法
一种基于多层设计空间缩减策略的近似高维优化方法
基于限流级差配合的城市配电网高选择性继电保护方案
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
社交网络的差分隐私保护方法
面向隐私保护的地理社交网络个性化推荐方法研究
移动社交网络中面向多维隐私保护的安全查询方法研究
移动社交网络中关联社交关系的位置隐私保护研究