超高维数据统计推断

基本信息
批准号:11731011
项目类别:重点项目
资助金额:250.00
负责人:唐年胜
学科分类:
依托单位:云南大学
批准年份:2017
结题年份:2022
起止时间:2018-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:孙建国,朱利平,胡飞芳,朱仲义,瞿培勇,李会琼,唐安民,潘东东,陈丹
关键词:
高维协方差阵检验模型选择切片逆回归结构降维惩罚函数
结项摘要

With the development of computer and network information technology, high-dimensional data are increasingly emerged in biomedical and medical health. Unlike the traditional data, high-dimensional data have the following new features: the diversity of the data, the sparsity of the useful information, the dependency of the data and missingness of the data, which shows that the traditional statistical analysis methods can not be used to deal with these challenges. Hence, it is a pressing need to develop novel statistical methods to make statistical inference on high-dimensional data. Although there are some effective methods to analyze high-dimensional data with some features, they are far from meeting the increasing requirement. This project aims to develop some novel approaches to make statistical inference on high-dimensional data with some new features such as dependence, missing and unknown distributions, and establish their theories; and propose some novel approaches to model-free variable screen, new clinical design study, hypothesis test, subgroup analysis and interval censored data analysis.

随着计算机和网络信息技术的发展,在生物医学和医疗健康等领域涌现出大量的高维数据。与传统数据不同,高维数据具有类型多样、有用信息稀疏、数据相依以及缺失等新特征,致使经典的统计推断方法在分析这些数据时遇到了瓶颈。因此,针对高维数据的这些新特征发展新的统计推断方法是统计学目前迫切需要解决的关键问题。尽管针对高维数据的某些特征已发展了一些有效方法,但现有的统计推断方法远远不能满足现实发展需要。鉴于此,本项目拟针对高维数据的一些新特征如:相依、缺失、分布未知等,发展一些新的统计推断方法并建立其理论,进而研究它们在不依赖于模型假设的变量筛选、新型临床试验设计方法研究、假设检验、亚组分析、区间删失数据分析等中的应用。

项目摘要

对医疗健康大数据的有效收集和挖掘,可为患者提供精准的个体化诊断和治疗方案。与传统数据不同,医疗健康大数据具有维数高、数据量大但信息稀疏、类型多样且结构复杂、数据相依以及缺失等新特征。尽管针对此类数据的某些特征已发展了一些有效的统计推断方法,但现有的统计推断方法远远不能满足现实发展需要。因此,本项目针对生物医学、遗传学、临床试验以及医疗健康等领域出现的大数据发展新的统计推断方法具有十分重要的理论和现实意义。.本项目的主要研究内容包括:在高维数据框架下提出了广义的多组平衡重要协变量的自适应随机化临床试验设计新方案以及筛选生物标记物的新方法,在超高维数据框架下发展了协变量选择自适应设计方案及其渐近马氏链的理论,在自适应设计下建立了检验有关处理效应假设的理论框架以及基于海量流数据的聚类自适应Network数据A/B检验过程,在超高维缺失数据情况下提出了可适用于两个试验组的连续型协变量自适应临床设计方案,针对超高维复杂相依数据发展了一系列亚组分析新方法并建立了其理论和算法,针对超高维数据提出了一系列不假设数据模型的特征筛选方法以及拟合优度检验方法,针对超高维协变量的区间删失数据模型基于广义估计方程发展了有效的统计推断理论等。在国内外重要学术刊物,如:《JASA》、《AoS》、《JRSSB》、《JoE》、《JBES》、《JMLR》等上发表学术论文91篇;在科学出版社出版专著2部,在国际出版社Intechopen主编出版学术论文集3部;获计算机软件著作权3项。获云南省自然科学二等奖1项。.项目执行期间,组织或承办国内国际学术会议9次;项目组成员中,1人当选IMS Fellow,1人获“国家杰出青年科学基金”,1人晋升副教授,1人获“云南省最美科技工作者”称号,1人获ICSA 杰出服务奖,1人获“云南省中青年学术和技术带头人”称号。培养出站博士后8人,毕业博士研究生18人、硕士研究生39人, 其中1名博士生的博士学位论文获云南省优秀博士学位论文。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
5

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019

唐年胜的其他基金

批准号:11426005
批准年份:2014
资助金额:60.00
项目类别:数学天元基金项目
批准号:11671349
批准年份:2016
资助金额:50.00
项目类别:面上项目
批准号:11526027
批准年份:2015
资助金额:75.00
项目类别:数学天元基金项目
批准号:11726615
批准年份:2017
资助金额:20.00
项目类别:数学天元基金项目
批准号:11726024
批准年份:2017
资助金额:60.00
项目类别:数学天元基金项目
批准号:11626020
批准年份:2016
资助金额:68.00
项目类别:数学天元基金项目
批准号:11226012
批准年份:2012
资助金额:25.00
项目类别:数学天元基金项目
批准号:10961026
批准年份:2009
资助金额:20.00
项目类别:地区科学基金项目
批准号:11326011
批准年份:2013
资助金额:58.00
项目类别:数学天元基金项目
批准号:11826027
批准年份:2018
资助金额:60.00
项目类别:数学天元基金项目
批准号:10226005
批准年份:2002
资助金额:2.50
项目类别:数学天元基金项目
批准号:10561008
批准年份:2005
资助金额:24.00
项目类别:地区科学基金项目
批准号:12126362
批准年份:2021
资助金额:20.00
项目类别:数学天元基金项目

相似国自然基金

1

超高维半参数回归模型的统计推断

批准号:11071077
批准年份:2010
负责人:朱利平
学科分类:A0402
资助金额:25.00
项目类别:面上项目
2

高维数据统计推断专题讲习班

批准号:12126428
批准年份:2021
负责人:潘东东
学科分类:A0402
资助金额:20.00
项目类别:数学天元基金项目
3

高维数据的图模型学习与统计推断

批准号:11201479
批准年份:2012
负责人:尹建鑫
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
4

超高维复杂数据统计降维研究

批准号:11771215
批准年份:2017
负责人:来鹏
学科分类:A0402
资助金额:48.00
项目类别:面上项目