具有复杂结构的几类计数数据模型的变量选择和统计诊断研究

基本信息
批准号:11561035
项目类别:地区科学基金项目
资助金额:35.00
负责人:付英姿
学科分类:
依托单位:昆明理工大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:詹金龙,赵宁,柳士峰,鲁丽英,吕静,蹇煜琨
关键词:
贝叶斯变量选择缺失数据EM算法统计诊断计数数据
结项摘要

The count data are widely encountered in the fields of biomedical, genetics, insurance, Actuarial science and risk management etc. By borrowing the new ideas and theories in variable selection and statstical diagnostics in recent years, several types of regression models for count data with complex structure are examined. To be particular, by fully analyzing the data feature such as overdispersion, zero-inflation, missingness, skewness as well as heterogeneity, we establish the corresponding regression models. And then, the issues of variable selection for above models are investigated based on both Bayesian analysis and penalized likelihood approaches respectively. Moreover, statistical diagnostics and Bayesian local inference analysis related to these models are also considered. An efficient variable selection procedure and an appropriate diagnostical measure are to be developed. Our research is the natural extension and generalization of the hot issues in modern statistics. The corresponding results not only provide the necessary support for complex count data analysis theoretically and methodologically, but also can be used for reference for practical workers in large. The expected research results include 7-10 papers which are to be published in well-known academic journals.

本项目以生物医学、遗传学、保险、精算以及风险控制等领域中广泛存在的计数数据为研究对象,并借鉴近年来变量选择和统计诊断研究方面的新思路新方法,拟对具有复杂结构的几类计数数据回归模型展开深入研究。具体的,通过全面分析计数数据所呈现的特征(如散度偏大、零点膨胀、数据缺失、具有偏态特征以及“异质性”等),有针对性的建立起上述数据的回归模型;在此基础上,拟分别从贝叶斯分析和惩罚似然的角度研究上述模型的变量选择问题并进一步考查模型在影响诊断与贝叶斯局部影响分析等方面的理论方法,希望建立有效的变量选择程序与合理的统计诊断度量。本项目的研究是当代统计学中热点问题的自然结合和推广,其相关研究不仅为复杂计数数据研究提供理论和方法上的支持,还可能为实际工作者提供技术上的参考。其预期研究成果为论文,预计在国内外重要学术刊物上发表论7-10篇。

项目摘要

本项目以现实生活中普遍存在的复杂计数数据为主要研究对象,广泛借鉴近年来统计计算和贝叶斯分析方面的新思路和新方法,得到如下三方面的研究成果:(1)复杂空间地质数据的贝叶斯后验推断研究。在该研究中,本项目以中国大陆地区地震数据为主要考查对象,分别讨论了空间可加模型下灵活贝叶斯分位数回归和混合变量的联合贝叶斯空间建模两方面的内容;(2)生物医学数据中贝叶斯变量选择及统计推断研究。具体的,本项目在生物学背景下分别讨论了基于有序分类变量的部分线性可加模型的贝叶斯分位数回归、高维计数数据的copula建模以及copula分位数回归及变量选择研究三方面的内容;(3)copula框架下动态系统性风险度量。为了深入研究金融部门间的相关关系,准确度量系统的风险溢出效应,本研究采用了高维CoVaR系统性风险评估方法并结合动态copula建模技术,系统考查了系统性风险随时间的演变趋势;在此基础上,还考查了copula框架下基于自激励门限自回归模型的系统性风险的度量和投资组合的选择问题。. 本项目的研究内容来源于巨灾防控、癌症相关的基因筛查、公共健康等领域,其相关研究成果中涉及到的贝叶斯“Disease Mapping”技术、贝叶斯有限混合建模以及复杂结构下贝叶斯变量选择等相关研究是当代统计学中热点问题的自然结合和推广,丰富和发展了现有的贝叶斯分析理论,是一项有价值的探索;此外,针对高维、超高维计数数据的变量选择研究、基于D-vine的动态CoVAR度量等成果也丰富和填补了国内相关研究领域的空白,为决策者以及长期从事医疗卫生、疾病防控、临床医院研究的一线工作者提供了有益的参考,具有广泛的应用前景。. 本项目在执行期内,已发表论文4篇,由于审稿周期的延长,仍有三篇论文处于审稿状态;培养毕业硕士研究生4人;参加国际会议9人次。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:
5

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020

付英姿的其他基金

批准号:11126310
批准年份:2011
资助金额:3.00
项目类别:数学天元基金项目
批准号:11201200
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

复杂数据下众数回归模型的变量选择及统计诊断研究

批准号:11561075
批准年份:2015
负责人:李会琼
学科分类:A0403
资助金额:34.00
项目类别:地区科学基金项目
2

具有复杂相关结构的几类统计模型的理论与应用研究

批准号:11171065
批准年份:2011
负责人:林金官
学科分类:A0402
资助金额:45.00
项目类别:面上项目
3

面板计数数据模型的非参数和半参数统计推断

批准号:11771366
批准年份:2017
负责人:赵兴球
学科分类:A0402
资助金额:48.00
项目类别:面上项目
4

几类函数型数据模型的统计推断方法

批准号:11771032
批准年份:2017
负责人:张忠占
学科分类:A0403
资助金额:48.00
项目类别:面上项目