面向大数据的统计分布式计算及隐私保护的理论与方法

基本信息
批准号:92046005
项目类别:重大研究计划
资助金额:20.00
负责人:周勇
学科分类:
依托单位:华东师范大学
批准年份:2020
结题年份:2021
起止时间:2021-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:李超君,明静思,彭梦姣,郁淼淼,李子洋,赵志嵩,张鸿飞,苏瑾
关键词:
分布式计算非光滑损失函数大数据分析高效通讯数据隐私
结项摘要

In the big data era, the research focuses on the frontiers of distributed computing that solves the basic problems in management and decision-making, which are effectively applicable in the analysis and modeling of large-scale data set scenarios. More specifically, we develop the communication-efficient and non-iterative distributed algorithm for non-smooth loss function and complex loss function of U-type statistics, respectively. At the same time, the properties of parameter estimation under communication-efficient distributed computing are given, so that the method has good interpretability in the applications and can carry out effective statistical inference. Finally, we discuss the data security issues that are of great concern in big data analysis based on the distributed algorithm and propose the scientific and reasonable data privacy protection technologies to achieve the balance between the requirements of data privacy and the efficiency of the computing and inference. The above methods will be widely applied in the areas of management, finance, biomedicine, and high-precision industries to provide guidance for management.

本项目聚焦于分布式计算的前沿探索,是一项解决大数据管理决策问题的基础性研究。首先对于非光滑损失函数以及U统计量类型的损失函数设计非迭代且高效通讯的分布式算法,使得提出的方法可以有效地应用于大规模数据集场景的分析与建模。同时给出算法中参数估计的统计性质,以使方法在实际应用中具有良好的解释性,并能进行有效的统计推断。最后基于大数据分布式算法,围绕大数据分析中备受关注的数据安全问题开展讨论,提出科学合理的隐私保护技术与方法,最终达到使以上研究的分布式计算方法既能满足数据安全要求,又不破坏原有的数据通讯以及统计推断效率的目的,并将其应用到管理、金融、生物医学、高精密行业的实际场景,为管理决策提供咨询建议和指导。

项目摘要

本项目聚焦于分布式计算以及数据隐私保护的前沿探索,是一项解决大数据管理决策问题的基础性研究,取得了如下的创新研究成果:(1)在分布式算法中,针对梯度不一定存在的非光滑目标函数,项目组提出用基于等度连续性的次梯度取代梯度信息的方法,以及用局部光滑函数近似的方法,来保证高效通信算法的可行性;(2)为克服不可必免的数据污染,以及对抗潜在数据攻击的威胁,项目组认为提出在分布式算法中针对传输整合梯度信息的关键步骤,运用MOM估计克服不良数据对梯度信息造成的影响;(3)为了有效利用外部总结性辅助信息,项目组提出加强的经验似然方法、增广广义估计方程方法、相乘似然函数与置信密度方法等框架来有效整合部分个体数据与外部总结性辅助信息结果,并在大数据情形下进一步考虑各辅助信息整合框架的通讯有效的迭代算法等分布式统计推断方法;(4)针对分布式算法数据传递过程中可能存在的隐私泄露问题,项目组提出基于扰动的梯度信息以及扰动的初始值构造的通讯有效算法,达到既能进行有效的统计推断,又能保证数据安全的目的。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

DOI:
发表时间:2020
2

基于MCPF算法的列车组合定位应用研究

基于MCPF算法的列车组合定位应用研究

DOI:
发表时间:2016
3

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
4

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

DOI:
发表时间:2021
5

非牛顿流体剪切稀化特性的分子动力学模拟

非牛顿流体剪切稀化特性的分子动力学模拟

DOI:10.7498/aps.70.20202116
发表时间:2021

周勇的其他基金

批准号:49801010
批准年份:1998
资助金额:13.00
项目类别:青年科学基金项目
批准号:20176031
批准年份:2001
资助金额:19.00
项目类别:面上项目
批准号:10171103
批准年份:2001
资助金额:4.00
项目类别:面上项目
批准号:61905059
批准年份:2019
资助金额:24.00
项目类别:青年科学基金项目
批准号:31100863
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:51207129
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:40671078
批准年份:2006
资助金额:38.00
项目类别:面上项目
批准号:61074168
批准年份:2010
资助金额:39.00
项目类别:面上项目
批准号:40271056
批准年份:2002
资助金额:40.00
项目类别:面上项目
批准号:50275096
批准年份:2002
资助金额:18.00
项目类别:面上项目
批准号:41271534
批准年份:2012
资助金额:75.00
项目类别:面上项目
批准号:21503001
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:61202252
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:21873004
批准年份:2018
资助金额:66.00
项目类别:面上项目
批准号:81800196
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:61273065
批准年份:2012
资助金额:84.00
项目类别:面上项目
批准号:71271128
批准年份:2012
资助金额:55.00
项目类别:面上项目
批准号:19701037
批准年份:1997
资助金额:3.50
项目类别:青年科学基金项目
批准号:10971197
批准年份:2009
资助金额:24.00
项目类别:面上项目
批准号:81370232
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:51601133
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:11804196
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:11271309
批准年份:2012
资助金额:60.00
项目类别:面上项目
批准号:71563046
批准年份:2015
资助金额:30.00
项目类别:地区科学基金项目
批准号:10471140
批准年份:2004
资助金额:20.00
项目类别:面上项目
批准号:50608057
批准年份:2006
资助金额:26.00
项目类别:青年科学基金项目
批准号:20971048
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:21773114
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:21376151
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:50975216
批准年份:2009
资助金额:36.00
项目类别:面上项目
批准号:10971173
批准年份:2009
资助金额:26.00
项目类别:面上项目
批准号:31760074
批准年份:2017
资助金额:39.00
项目类别:地区科学基金项目
批准号:10371103
批准年份:2003
资助金额:10.00
项目类别:面上项目
批准号:81500065
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:30701002
批准年份:2007
资助金额:17.00
项目类别:青年科学基金项目
批准号:20804054
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:11671339
批准年份:2016
资助金额:48.00
项目类别:面上项目
批准号:10501012
批准年份:2005
资助金额:14.00
项目类别:青年科学基金项目
批准号:61572505
批准年份:2015
资助金额:64.00
项目类别:面上项目
批准号:91739108
批准年份:2017
资助金额:60.00
项目类别:重大研究计划
批准号:91546202
批准年份:2015
资助金额:240.00
项目类别:重大研究计划
批准号:81670115
批准年份:2016
资助金额:57.00
项目类别:面上项目
批准号:81801852
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:30901474
批准年份:2009
资助金额:19.00
项目类别:青年科学基金项目
批准号:51568042
批准年份:2015
资助金额:40.00
项目类别:地区科学基金项目
批准号:41602133
批准年份:2016
资助金额:18.00
项目类别:青年科学基金项目
批准号:81870084
批准年份:2018
资助金额:55.00
项目类别:面上项目
批准号:30901427
批准年份:2009
资助金额:22.00
项目类别:青年科学基金项目
批准号:21473091
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:71331006
批准年份:2013
资助金额:227.00
项目类别:重点项目
批准号:61601231
批准年份:2016
资助金额:21.00
项目类别:青年科学基金项目
批准号:31802346
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:81272441
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:38970890
批准年份:1989
资助金额:3.00
项目类别:面上项目

相似国自然基金

1

网络数据隐私保护的统计方法研究

批准号:11771171
批准年份:2017
负责人:晏挺
学科分类:A0403
资助金额:48.00
项目类别:面上项目
2

面向隐私保护的数据挖掘方法研究

批准号:60403041
批准年份:2004
负责人:童云海
学科分类:F0210
资助金额:22.00
项目类别:青年科学基金项目
3

面向隐私保护的云数据访问模型与方法研究

批准号:61462069
批准年份:2014
负责人:谭跃生
学科分类:F0205
资助金额:44.00
项目类别:地区科学基金项目
4

面向隐私保护的分布式数据挖掘关键问题研究

批准号:61075053
批准年份:2010
负责人:申艳光
学科分类:F0605
资助金额:10.00
项目类别:面上项目