In biomedical research, ones often need to deal with categorical data, which is becoming one of the hot issues to be discussed in the present domestic and foreign statistical analysis. However, in the matched-pair study for two kinds of treatments, the data is missing because of death、migration of matchable subjects or drop out due to adverse effect caused by treatments;In longitudinal data,because the respondents are abroad or transfer, or died, so that researchers can not completely observe the data of subjects, this is the so-called incomplete data. In this case, the standard statistical methods cannot be applied directly to analy these incomplete categorical data. Based on the incomplete 2×2 contingency tables, high dimensional incomplete 2×2 contingency tables and incomplete ordered categorical data form the K×K table,when n and m are random,this project will study their statistical inference. This project will also provide a set of systematic analysis theory of the incomplete data, explores the simple and easy method to calculate confidence intervals. Meanwhile, various statistical methods with the MAR missing data mechanism apply to nonignorable mechanism.
在生物医学研究中经常需处理分类数据,分类数据分析是目前国内外研究的热门课题之一。然而,在两种处理方法的配对研究中,由于被研究的配对对象的去死、搬迁或处理方法本身的副作用等原因致使研究人员不能得到被试者的数据,因而造成一些数据的缺失;在纵向数据研究中,由于被调查者的出国或工作调动、或者死亡等原因而导致数据的缺失,这就是所谓的不完全数据。在这种情况下,标准的统计方法不能直接应用到这些不完全分类数据的统计分析。为此,本项目将基于不完全2×2列联表、高维的不完全2×2列联表及不完全的有序分类数据构成的K×K表研究完全可观测的配对数n和不完全可观测的配对数m是随机变量时的有关统计推断问题,建立一套系统分析不完全分类数据的分析理论,探索出计算置信区间上下限的简单易行的方法,同时将带有MAR缺失数据机制的各种统计方法推广到不可忽略缺失机制下的不完全分类数据中。
在一些流行病学研究中,人们常常想知道同一类药物的两种药品药效、同一疾病的两种处理方法的成功率是否一样?特别在新药(副作用小或价格便宜)研发过程中,药物管理部门常需要新药研发部门提供新药与目前市场上使用的同类药(副作用大或价格昂贵)的药效比较的临床试验报告。为此,人们常常考虑配对设计下的等价性检验。然而,在药物药效研究中,由于药物本身的副作用而致使某些病人放弃使用该药物的医治,因而造成一些数据的缺失;在两种处理方法的研究中,由于被研究的配对对象的去死、搬迁或处理本身的副作用导致研究人员不能完全得到被试者数据,从而导致一些数据的缺失;在纵向数据研究中,由于被调查者的出国或工作调动、或者死亡等原因而导致数据的缺失,这就是所谓的不完全数据。在这种情况下,标准的统计方法不能直接应用到这些不完全数据的统计分析。因此,对不完全配对的2×2列联表,当配对数据,不完全数据都是给定时, 本项目采用MOVER方法考虑了基于风险比的Wilson Score置信区间、Agresti-Coull置信区间和 Jeffrey置信区间;对上述不完全配对2×2列联表,本项目还研究了当配对数据,不完全数据都是随机数时风险比的置信区间问题和Bayes统计推断问题。另外,对含有缺失数据的R×C列联表,当我们仅仅固定总样本量,而对配对的样本量和不完全配对的样本量考虑随机时,原来的抽样分布就有问题。本项目考虑了这种条件下的精确抽样分布问题,同时还比较了新抽样分布和原来抽样分布的分布、参数估计等区别。.由于药物药效不仅受剂量的影响外,还可能受病人的性别、年龄和诸如病人是否吸烟和喝酒等生活习惯的影响,因此,为了比较两种药物的药效,研究者通常将病人按照年龄、性别或生活习惯等分成若干组,此时研究者关心的是这两种药物的药效是否与病人的年龄、性别或生活习惯等因素有关。因此,本项目研究了K个不完全2×2列联表基于风险差和gamma相关系数的齐性检验、多重检验和置信区间问题。.在临床流行病学研究中,泊松分布能描述某个罕见疾病的发生。因此,本项目基于Fieller's定理,对数变换和替代方法的无条件MOVER方法研究了两个泊松分布风险比的置信区间。. 相对于对称分布,偏态分布更能获得更全面准确、更及时有效的信息。针对偏态异方差数据,本项目推广了经典回归模型,研究了联合位置与尺度模型,并提出了一种同时对位置模型和尺度模
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
播种量和施氮量对不同基因型冬小麦干物质累积、转运及产量的影响
基于旋量理论的数控机床几何误差分离与补偿方法研究
智能煤矿建设路线与工程实践
基于不完全配对数据的统计推断
医学研究中不完全纵向数据的统计推断及变量选择方法
因果推断及不完全数据的统计分析
相依与不完全数据的统计推断及其应用研究