高维纵向数据分位数回归中的统计推断研究

基本信息
批准号:11871376
项目类别:面上项目
资助金额:50.00
负责人:唐炎林
学科分类:
依托单位:华东师范大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:钱伟民,李莉娜,胡艳平,孔翠娟,杨坤
关键词:
全基因组关联分析统计推断纵向数据高维数据分位数回归
结项摘要

In this project, we study statistical inference and related problems in high-dimensional quantile regression with longitudinal data. The main contents include the following parts. Firstly, we will study the conditional global test in high-dimensional quantile regression with longitudinal data. Conditional on some pre-selected subset Z, we propose a weighted test statistic consisting of sum- and maximum-type statistics, based on the score functions of the conditional marginal quantile regression; we consider the intra-subject correlation structure to improve the estimation efficiency and enhance the power of the test; the test can control the family-wise error rate and has high powers for both sparse large signals and weak dense signal. Secondly, we will study the coordinates tests in high-dimensional quantile regression with longitudinal data. We propose a de-biased estimator to make inference; we allow small coefficients in the regression model, which converge to zero at a fast rate; we consider the intra-subject correlation structure to improve the estimation efficiency; we consider partial correction to balance the bias-variance tradeoff; the critical values are constructed by wild bootstrap method. Thirdly, we will study the statistical inference in high-dimensional non-sparse quantile regression with longitudinal data. We use properties of the smoothed quantile regression estimator to prove the asymptotic normality of the standard quantile estimator. Fourthly, we consider statistical inference in quantile regression of the additive models with longitudinal data. We approximate the nonparametric function by B-splines, and borrow information from auxiliary conditional mean regression, to consider intra-subject correlation structure and to improve the estimation efficiency of the quantile regression estimator, where we use different orders of numbers of interior knots in the auxiliary model and quantile regression model. Finally, we apply these tests to the real data analysis, such as the Genome-wide association study.

本课题研究高维纵向数据分位数回归(QR)的统计推断及相关问题,主要内容如下。一、高维纵向数据QR的条件整体显著性检验。在预选子集Z给定条件下,基于条件边际QR得分函数提出求和型与最大型的加权统计量;利用个体内部相关结构提高估计效率,进而提高检验功效;可控多重比较错误率,在稀疏强信号和稠密弱信号下均有高功效。二、高维纵向数据QR的分量推断。通过消偏估计量进行分量推断;允许快速趋向于零的小系数存在;利用个体内部相关结构;考虑自适应部分消偏以达到偏差方差平衡;用自助法模拟临界值。三、高维非稀疏纵向数据QR中的统计推断。利用光滑化QR估计量的性质,证明标准QR估计量的渐近正态性。四、纵向数据可加模型QR中的统计推断。用B样条逼近非参数函数,利用均值回归的附属信息考虑个体内部相关结构,改进QR估计效率,附属信息求权重和加权QR估计中使用不同阶的内节点数。最后,应用于实际数据,如全基因组关联分析。

项目摘要

围绕大数据人工智能这个国家重点战略,从以下七个方面进行了研究。.一、高维分位数回归的条件整体显著性检验问题:基于条件边际回归的最大型得分统计量,对数量庞大的候选标记物的推断提供了一种简单的新检验方法。.二、高维线性模型纠偏LASSO综述&高维分位数图模型的构建问题:介绍了三种主要的纠偏LASSO估计的思想与方法;提出了一种快速计算精度矩阵的方法,以大大减少图模型纠偏过程中精度矩阵的计算成本,在纠偏分位数回归的基础上建立了边的整体性假设检验。.三、基于得分的高维纵向数据分位数回归中的检验问题:受肾小球过滤速率数据的启发,我们为纵向数据构造了一个新的稳健检验,用于检测高维分位数回归中标记物的效应。检验统计量基于分位数回归中得分型统计量的求和,可以有效检测稠密信号。.四、高维无结构分位数回归中的处理效应估计及检验问题:利用卷积光滑将分位数损失函数进行光滑,使其可导,进一步结合Neyman正交性与广义随机森林,降低对干扰参数估计误差的敏感性。.五、基于隐私保护的不完全数据统计建模:隐私保护日益受到重视,匿名调查成为常态,由此造成的数据不完整,给统计建模带来极大挑战。我们开创性地提出分块和子抽样分别构造检验统计量,解决了无序配对两样本的处理效应检验问题。.六、高维相依数据的统计推断:构建新的统计方法,从庞杂的系统中筛选出对供电系统恢复能力、风力发电站选址有重要影响的因素,结合数据相依性,提高预测精度和可解释性。.七、服务于精准医疗的亚组分析:基于非齐次隐马尔科夫等模型,结合贝叶斯推断等方法,对亚组进行识别、建模。.科学意义:研究围绕大数据人工智能这个国家重点战略,从基于隐私保护的不完全数据统计建模、高维相依数据的统计推断、服务于精准医疗的亚组分析等方面做出了突出的成绩,为这几方面的研究提供了理论、方法论上的贡献,具有很强的社会影响力和很大的潜在应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
3

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

唐炎林的其他基金

批准号:11301391
批准年份:2013
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

复发事件的均值模型和纵向数据的分位数回归的统计与推断

批准号:11401603
批准年份:2014
负责人:刘玉涛
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
2

复杂纵向数据的统计推断

批准号:11231010
批准年份:2012
负责人:孙六全
学科分类:A0402
资助金额:220.00
项目类别:重点项目
3

不完全数据下若干分位数回归模型的统计推断研究

批准号:11901149
批准年份:2019
负责人:姚梅
学科分类:A0403
资助金额:21.00
项目类别:青年科学基金项目
4

面板数据分位数回归中的模型选择问题研究

批准号:11301391
批准年份:2013
负责人:唐炎林
学科分类:A0402
资助金额:22.00
项目类别:青年科学基金项目