Most recently, the analysis of recurrent event data is a statistical hotspot in literature, and their applications in biomedical and clinical trials, and in the analsyis of economic data have been extensively discussed as well. However, so far as we know, only the models with low-dimensional covariates in recurrent event data can be found in literature. And hence then, the target of this project is to study the techniques of dimension reduction of the recurrent event data with high-dimensional covariates, and to consider their applications in the analysis of medical cost and the actuarial data. The following points are the most interested of mine: the first is to study the technique of dimension reduction for the data of the single-type recurrent events with high-dimensional covariates, the theoretical results of dimension reduction for the recurrent events data with high-dimensional covariates will be established based on the marginal mean and/or rate functions, intensity functions models of the accumulatively incurred numbers, the gap times between the successive two events and the event times. The second is to study the problems mentioned before, but based on the multi-types recurrent event data, the correlation of the data from the different types is the most interesting point. The third is to discuss the method of dimension reduction for the recurrent event data with a time-varying coefficient and/or time-varying covariates, in which to estimate the time-varying coefficient is the most important problem. Finally, the application of the resulted methods of dimension reduction discussed above will be the interest of mine. Together with the marked point processes, the techniques of dimension reduction will be used to study the medical cost and claims in actuarial science. The recurrent event, however, have many special features that complicate and pose major challenges in statistical inference, and hence then, the project is a highly significant, very important and interesting problem to be study. The goal of this project is to establish the theoretically results of dimension reduction and their applications of the recurrent event data with high-dimensional covariates.
复发事件数据是近年来的研究热点,它在生物医学试验,经济数据分析等方面具有广泛的应用前景. 而现存的文献主要研究低维协变量的情形. 本项目主要研究复发事件中高维协变量降维技术及其应用. 我们主要从四个方面研究:一是研究单个类型复发事件中高维协变量的降维,我们将建立含有高维协变量的累积复发次数、复发间隔和事件时间的边际均值或率函数模型、风险函数模型,进而研究各个模型的降维技术;二是我们将研究多个类型复发事件数据中高维协变量的降维技术,恰当处理多个事件类型之间的相依性是此问题的研究重点;三是研究单或多类型复发事件中含有高维协变量的变系数模型的降维方法;最后我们将结合标记点过程,研究含有高维协变量的复发事件模型在医疗费用数据和保险精算中的索赔问题中的应用。基于复发事件数据的复杂性,该项目是具有挑战性的研究课题,将为含有高维协变量的复发事件数据的研究建立新的理论根据和提供新的研究方法。
复发事件数据是近年来的研究热点,它在生物医学试验,经济数据分析等方面具有广泛的应用前景。由于复发事件数据涉及到多个事件过程,包括删失事件过程,终止事件过程,同时这多个事件过程又具有复杂的相依关系,因此复发事件数据的研究具有很大的挑战性。 随着计算机技术的发展,数据收集和处理的技术得到空前的发展,因此伴随着复发事件数据的附加信息(协变量)大量涌现,这些附加信息又对复发事件的分析有着重要影响。但是,现存的文献主要研究复发事件中含有低维协变量的情形,因此研究复发事件数据中高维协变量的降维技术及其应用是具有较大理论和应用价值的课题。经过四年的努力,我们取得了如下的研究结果:一是研究了单个类型复发事件中高维协变量的降维,在乘积边际均值或率函数模型假设下,我们建立含有高维协变量的累积复发次数、复发间隔模型,利用充分降维中的逆回归方法(IR)和最小平均方差估计(MAVE)方法研究各个模型的降维技术,并研究了乘积均值、可加均值的复发次数模型的部分充分降维技术。二是我们研究了多个类型复发事件数据中高维协变量的降维技术,我们利用连接函数(copula)去描述多个过程之间的相依关系,并将其应用到保险精算的问题中。三是研究了复发事件的部分非线性指标模型的基于分位数的稳健变量选择方法,不同于充分降维是寻找全部变量的线性组合,变量选择方法是从诸多变量中挑选出重要变量。 四是我们将得到的研究结果,广泛应用到了医疗费用评估和保险精算索赔数据的分析中,这些应用包括终身医疗费用、医疗保险数据、汽车保险索赔数据等等,模型包括部分非线性指标模型,部分线性可加指标模型,所用的降维方法包括充分降维和变量选择这两种主流的降维方法。. 基于复发事件数据的重要性和复杂性,该项目的上述研究成果将为进一步研究复发事件中含有高维协变量的降维技术和应用提供理论上和应用上的参考价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
回归中高维数据的“充分”降维
多维因变量充分降维与多总体共同充分降维方法研究
生物特征识别中高维数据的统计降维及算法研究
高维协变量下部分线性风险回归模型的变量选择