加速失效时间模型中GCC抽样的统计推断及最优设计研究

基本信息
批准号:11301545
项目类别:青年科学基金项目
资助金额:22.00
负责人:杨青龙
学科分类:
依托单位:中南财经政法大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:蒋学军,王敏,鲁鸽,孙金绣
关键词:
加速失效时间模型广义病例队列设计生存分析加权估计方程
结项摘要

Epidemiologic cohort studies are routinely conducted to assess the effects of covariates on a failure time. Accelerated failure time model has attracted considerable attention in recent years because it relates the logarithm of the failure time linearly to the covariates directly. In some large cohort studies, some covariates can't be measured on all cohort numbers due to financial constraints or technical difficulties. It is desirable to assemble covariates for a subsample selected by chosing a cost-effective sampling design in order to improve study efficiency. Case-cohort design is appealing for large cohort studies of rare diseases which includes all cases and a simple random sample. However, when the events is not rare, it is desirable to considered a generalized case-cohort(GCC) design, where only a fraction of cases are sampled. Right-censoring and GCC design pose a challenge on statistical inference for the accelerated failure time model with GCC design. The estimating equation based on traditional statistical method is biased and discrete. This proposal targets at developing methods and theory to establish the statistical inference procedures for the accelerated failure time model with GCC design. Specifically, this proposal develops the methods of corrected estimating equation by weighted function, employs the techniques of smooth approximate and kernel smoothing, establishes a series of statistical inference procedures for GCC sampling in the accelerated failure time model by using the related theory of empirical processes, and explores the optimal design of GCC sampling. Furthermore, extensive simulation studies will be conducted and an ongoing lung cancer study analyzed to demonstrate the utility of the proposed methods.

在流行病研究中,常需要考察协变量对生存时间的影响。加速失效时间模型直接建立对数生存时间与协变量之间的线性回归关系,具有很强的解释性。在大型队列研究中,由于预算限制或技术难题,协变量无法对所有个体进行测量。可通过选取一种有效的抽样方法来抽取子样本观测协变量以提高研究效率。病例队列抽样只抽取一个简单随机样本和所有病例,在大型队列的罕见病研究中引起了极大关注。然而,当发病率较高时,使用广义病例队列研究,只抽取部分病例。删失和抽样有偏性给加速失效模型中GCC抽样的统计推断带来巨大挑战。基于传统统计方法所得估计方程有偏和不连续的。本项目拟在该问题上开展一些原创性的研究。该项目提出加权修正估计方程方法,采用光滑逼近和核光滑技术,利用经验过程理论,建立一系列加速失效时间模型的统计推断方法,并探索GCC抽样的最优设计问题。通过丰富的计算机模拟阐明所提出方法的实用性,并将之应用于一项正在进行的肺癌研究中。

项目摘要

在大型流行病学研究中,研究节约成本提高效率的抽样设计并建立相应的统计推断方法显得非常重要。广义病例队列设计(GCC)是一种在实际中广泛应用的节约成本提高效率的抽样设计方法,其在了解暴露因素对人类复杂疾病的影响有着深远的意义。本项目在广义病例队列设计(GCC)下,首先在加法风险模型的框架下,建立了未知回归参数的统计推断方法,并建立了估计量的大样本性质,模拟结果表明我们的方法可行。其次,在加速失效模型下,采用诱导光滑的方法建立了光滑的加权的Gehan估计方程来估计待估参数,建立了估计量的大样本性质,此外考虑了GCC设计的最优性。然后,建立了一类半参数转换速率模型来研究复发时间,通过估计方程的方法来估计未知的参数,并建立了相应估计量的相合性和渐近正态性。最后,通过边际分布危险率服从一般的危险模型来研究多元失效时间,通过估计方程的方法来估计未知参数,并给出共同的累积基准危险率函数的一个相合估计。此外,综合考虑企业的财务和非财务因素,利用 LASSO方法对企业财务困境预测指标进行筛选,然后使用决策树、随机森林、 SVM、最近邻法这四种数据挖掘方法,以及常见的 logistic模型,分别建立企业财务困境预测模型。在相关问题的研究中,大部分都运用模拟结果表明我们方法的优良性, 同时将其运用到实际数据中。此项目研究结果既有重要的理论意义又有广泛的应用前景。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

杨青龙的其他基金

相似国自然基金

1

缺失数据下加速失效时间模型的经验似然推断

批准号:11326178
批准年份:2013
负责人:袁晓惠
学科分类:A0402
资助金额:3.00
项目类别:数学天元基金项目
2

Bootstrap在复杂抽样中的统计推断

批准号:11901487
批准年份:2019
负责人:王中雷
学科分类:A0401
资助金额:25.00
项目类别:青年科学基金项目
3

概率抽样设计及其统计推断方法

批准号:11471335
批准年份:2014
负责人:许王莉
学科分类:A0402
资助金额:65.00
项目类别:面上项目
4

约束下时间序列模型统计推断

批准号:10571073
批准年份:2005
负责人:王德辉
学科分类:A0402
资助金额:23.00
项目类别:面上项目