Family studies are widely used in biomedical research nowadays to investigate the within-family dependence structure and genetic effects on the disease process, and hence infer the heritability of disease. Due to highly cost of obtaining biomarker information, biased sampling is frequently employed in family studies. For the biased, correlated and censored family disease onset times, in this project, we will use Copula model to obtain their joint distribution and use inverse probability weighting methods to adjust for the biased sampling. Considering not every person will develop disease, we introduce the death status and consider the joint modelling and statistical inference for multiple correlated illness-death processes. Regarding the biased and correlated secondary outcomes from family study, we will use Hierarchical Copula to model their joint distribution and use inverse probability weighting methods to adjust for biased sampling. Furthermore, based on our proposed models, we will develop cost-effective biased two-phase sampling designs such that more informative families could be sampled under budgetary constraints. Finally, we will apply the proposed sampling and analysis methods to the psoriatic arthritis data and rheumatic arthritis data, to guide family selection and to investigate the within-family dependence structure in the disease process and its risk factors, which can provide some suggestions and guidance to the clinicians and pharmaceutical staffs.
家系研究广泛地应用在生物医学领域来探究疾病过程的家庭内部相关性和基因对它的影响,从而推断疾病的遗传性质。由于获取生物标志信息的成本很高,家系研究中常常采用有偏抽样。本课题将针对有偏相依的带删失的家庭疾病时间,用Copula模型构建联合分布,并用逆概率加权的方法纠正有偏抽样的影响。进一步考虑到不是每个个体都会发病,我们引入死亡状态,研究多个有偏相依的疾病死亡过程的联合建模和统计推断问题。而针对有偏相依的次要结局变量,我们用Hierarchical Copula来构建它们的联合分布并用逆概率加权的方法来纠正样本的有偏性。此外,基于提出的研究模型,我们将设计成本效果合算的有偏二阶段抽样以期在有限成本下抽取能提供更多信息的家庭样本。最后将提出的抽样和估计方法应用到牛皮藓性关节炎和类风湿关节炎,来指导家庭样本的选取并探究疾病过程的家庭内部相依结构及其影响因素,给医生或从业人员提供建议和指导。
现代生物医学的观察性研究和临床试验都会定期采集参与者的基因信息和生物标志数据信息。这些信息的利用可以让我们更好地了解疾病的原理,遗传性质及其影响因素。但在研究中对全部生物样本做检测的成本非常高,常常需要采用有偏抽样的方式。本项目主要研究复杂医疗数据的统计推断和与之相关的二阶段抽样设计问题;尤其针对这些问题在家系研究、真实世界数据分析和临床试验中复发性事件的研究这三个具体领域的应用和拓展。. 在家系研究中,本项目提出了一种最优的二阶段抽样方案以期获得能提供更多信息的家庭样本。此外,我们把这个方法拓展到有辅助数据的情形下,进一步讨论利用辅助数据来提高估计的准确性和效率,并给出了此时的家庭最优被选概率。而针对家系研究中的有偏相依次要结局变量的统计推断问题,我们提出了基于Gaussian copula的联合建模方法,并利用遗传学中亲属关系的概念来简化相关结构的构建。这些方法都应用于牛皮癣性关节炎的家系研究中。. 在真实世界数据分析的研究中,尤其是针对电子病历数据,很多重要变量都存在着带信息的缺失问题。本项目在分位数回归的框架下,提出了一种新的逆概率加权的方法,可以基于观测到的电子病历数据合理并稳健地分析风险因素对疾病的影响,并应用于病人葡萄糖水平影响因素的研究上。. 在临床试验的研究中,随着ICH针对E9 Statistical Principles for Clinical Trials补充指导原则(E9 Addendum)的推出,复发性事件分析方法的选择和不同分析方法下Estimand的临床意义的研究引起了学术、药企和监管部门的重视。针对该问题,本项目基于理论推导和大量模拟实验,探讨了不同分析方法所对应的Estimand是什么以及各自的区别,并对复发性事件研究方法的选取以及相应的临床试验设计问题给出了建议。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
概率抽样设计及其统计推断方法
两阶段抽样设计及其统计推断方法
基于社交网络的敏感问题抽样设计与间接统计推断方法
Bootstrap在复杂抽样中的统计推断