The count data are widely encountered in the fields of biomedical, genetics, insurance, Actuarial science and risk management etc. By borrowing the new ideas and theories in variable selection and statstical diagnostics in recent years, several types of regression models for count data with complex structure are examined. To be particular, by fully analyzing the data feature such as overdispersion, zero-inflation, missingness, skewness as well as heterogeneity, we establish the corresponding regression models. And then, the issues of variable selection for above models are investigated based on both Bayesian analysis and penalized likelihood approaches respectively. Moreover, statistical diagnostics and Bayesian local inference analysis related to these models are also considered. An efficient variable selection procedure and an appropriate diagnostical measure are to be developed. Our research is the natural extension and generalization of the hot issues in modern statistics. The corresponding results not only provide the necessary support for complex count data analysis theoretically and methodologically, but also can be used for reference for practical workers in large. The expected research results include 7-10 papers which are to be published in well-known academic journals.
本项目以生物医学、遗传学、保险、精算以及风险控制等领域中广泛存在的计数数据为研究对象,并借鉴近年来变量选择和统计诊断研究方面的新思路新方法,拟对具有复杂结构的几类计数数据回归模型展开深入研究。具体的,通过全面分析计数数据所呈现的特征(如散度偏大、零点膨胀、数据缺失、具有偏态特征以及“异质性”等),有针对性的建立起上述数据的回归模型;在此基础上,拟分别从贝叶斯分析和惩罚似然的角度研究上述模型的变量选择问题并进一步考查模型在影响诊断与贝叶斯局部影响分析等方面的理论方法,希望建立有效的变量选择程序与合理的统计诊断度量。本项目的研究是当代统计学中热点问题的自然结合和推广,其相关研究不仅为复杂计数数据研究提供理论和方法上的支持,还可能为实际工作者提供技术上的参考。其预期研究成果为论文,预计在国内外重要学术刊物上发表论7-10篇。
本项目以现实生活中普遍存在的复杂计数数据为主要研究对象,广泛借鉴近年来统计计算和贝叶斯分析方面的新思路和新方法,得到如下三方面的研究成果:(1)复杂空间地质数据的贝叶斯后验推断研究。在该研究中,本项目以中国大陆地区地震数据为主要考查对象,分别讨论了空间可加模型下灵活贝叶斯分位数回归和混合变量的联合贝叶斯空间建模两方面的内容;(2)生物医学数据中贝叶斯变量选择及统计推断研究。具体的,本项目在生物学背景下分别讨论了基于有序分类变量的部分线性可加模型的贝叶斯分位数回归、高维计数数据的copula建模以及copula分位数回归及变量选择研究三方面的内容;(3)copula框架下动态系统性风险度量。为了深入研究金融部门间的相关关系,准确度量系统的风险溢出效应,本研究采用了高维CoVaR系统性风险评估方法并结合动态copula建模技术,系统考查了系统性风险随时间的演变趋势;在此基础上,还考查了copula框架下基于自激励门限自回归模型的系统性风险的度量和投资组合的选择问题。. 本项目的研究内容来源于巨灾防控、癌症相关的基因筛查、公共健康等领域,其相关研究成果中涉及到的贝叶斯“Disease Mapping”技术、贝叶斯有限混合建模以及复杂结构下贝叶斯变量选择等相关研究是当代统计学中热点问题的自然结合和推广,丰富和发展了现有的贝叶斯分析理论,是一项有价值的探索;此外,针对高维、超高维计数数据的变量选择研究、基于D-vine的动态CoVAR度量等成果也丰富和填补了国内相关研究领域的空白,为决策者以及长期从事医疗卫生、疾病防控、临床医院研究的一线工作者提供了有益的参考,具有广泛的应用前景。. 本项目在执行期内,已发表论文4篇,由于审稿周期的延长,仍有三篇论文处于审稿状态;培养毕业硕士研究生4人;参加国际会议9人次。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
转录组与代谢联合解析红花槭叶片中青素苷变化机制
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
复杂数据下众数回归模型的变量选择及统计诊断研究
具有复杂相关结构的几类统计模型的理论与应用研究
面板计数数据模型的非参数和半参数统计推断
几类函数型数据模型的统计推断方法