大型观察性医学数据的因果图模型研究

基本信息
批准号:81502898
项目类别:青年科学基金项目
资助金额:13.00
负责人:杨伟
学科分类:
依托单位:中国中医科学院中医临床基础医学研究所
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:刘孟宇,蔺顺锋,刘大胜,边蓓蕾,雷蕾
关键词:
大型医学数据观察性研究因果图模型
结项摘要

With explosive growth of the amount of data in the bio-medical and health-care service and other fields, many large-scale observational databases which contain lots of medical information variables come into being. How to deduce the local causal relationship between variables from the data has become the basic goal and primary interests in the medical research. With probability expression and specific causal hypothesis to evaluate the causal effects, causal graphical models can present intuitively the correlation between variables through the graph to identify the causal relationship between the local variables. However, the latest causal graphical models cannot be reliably extended to the case containing a large number of variables and cannot be able to completely evaluate the causal effects of lots of variables within a reasonable period of time. Therefore, this study, based on the causal graphical learning algorithm, improves the constraints-based and scores-based learning strategies to find out the graphical learning optimal algorithm for the vast number of variables which adopts the strategy of the minimum value of casual effects and improves the methods of causal effects estimation to improve the accuracy of causal effects estimation. Based on several public and large observational medical databases, it is significant and valuable to build casual graphical models from lots of medical information variables and put the models into the exploration of causes and effects of practical medical problems in medicine.

现今大数据时代,生物医学、医疗服务业领域中的数据量也呈现爆炸式增长,产生了很多包含大量医学信息变量的大型观察性数据库。如何从数据中去推断变量之间的局部因果关系已经成为医学领域研究中最基本的追求和主要兴趣。因果图模型可以通过直观图展示变量间的相关关系,以概率表达及特定的因果假设理论估计变量间的因果效应,进而达到识别变量间局部因果关系的目的。但既往因果图模型学习算法在合理的时间内还不能可靠的扩展到包含大量变量的情况,且无法完全估计大量变量之间的因果效应。因此,本课题在现有因果图学习算法的基础上,改进约束和评分学习策略,研究适用于大量变量的图学习最优算法,采用最小因果效应值策略,改进因果效应估计方法,提高因果效应估计的准确性。基于多个开放性的大型观察性医学数据库,从大量医学信息变量中自动准确地构建因果结构,建立因果图模型并把它用于实际医学问题的因果探索中,具有很重要的理论和应用价值。

项目摘要

针对因果图模型中的有向无圈图(DAGs)学习算法MMHC算法在条件独立性约束和评分搜索两个阶段存在的问题。在MMHC算法的约束构建结构过程中采用蒙特卡洛非重复抽样技术(Monte Carlo Permutation test)对条件独立性进行检验,在评分搜索阶段用随机重启爬山搜索、以及禁忌搜索来替代爬山算法,研究了上述改进算法对DAGs学习效果的影响,选取最优的算法应用到DAGs学习。实验表明改进的算法提高了估计因果关系假设的准确性和构建结构的质量。在中成药上市后的安全性再评价研究的大背景下,针对HIS数据非随机化或者说存在大量混杂偏倚的特点,本文利用改进的算法从提取的HIS观察性数据中学习DAGs,基于因果概率模型的因果理论,分析使用丹红注射液对肝功能指标发生异常变化影响的因果效应。应用的结果表明,本论文的方法能够提供有效且更加可信的因果效应。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
5

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022

杨伟的其他基金

批准号:21074038
批准年份:2010
资助金额:36.00
项目类别:面上项目
批准号:41906006
批准年份:2019
资助金额:27.00
项目类别:青年科学基金项目
批准号:21374065
批准年份:2013
资助金额:82.00
项目类别:面上项目
批准号:31601511
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:51273069
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:51403048
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:20574021
批准年份:2005
资助金额:27.00
项目类别:面上项目
批准号:20734005
批准年份:2007
资助金额:175.00
项目类别:联合基金项目
批准号:51473054
批准年份:2014
资助金额:83.00
项目类别:面上项目
批准号:71203052
批准年份:2012
资助金额:19.00
项目类别:青年科学基金项目
批准号:U0634003
批准年份:2006
资助金额:100.00
项目类别:联合基金项目
批准号:51073110
批准年份:2010
资助金额:38.00
项目类别:面上项目
批准号:50973074
批准年份:2009
资助金额:35.00
项目类别:面上项目
批准号:51906168
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:41201423
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:11771371
批准年份:2017
资助金额:48.00
项目类别:面上项目
批准号:81302726
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:31270694
批准年份:2012
资助金额:78.00
项目类别:面上项目
批准号:50708104
批准年份:2007
资助金额:20.00
项目类别:青年科学基金项目
批准号:51461032
批准年份:2014
资助金额:48.00
项目类别:地区科学基金项目
批准号:41401317
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:21702073
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:11401109
批准年份:2014
资助金额:22.00
项目类别:青年科学基金项目
批准号:11401506
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:61806074
批准年份:2018
资助金额:22.00
项目类别:青年科学基金项目
批准号:71902013
批准年份:2019
资助金额:20.00
项目类别:青年科学基金项目
批准号:61801090
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:50503014
批准年份:2005
资助金额:25.00
项目类别:青年科学基金项目
批准号:50173008
批准年份:2001
资助金额:24.00
项目类别:面上项目
批准号:51873126
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:71673074
批准年份:2016
资助金额:50.00
项目类别:面上项目

相似国自然基金

1

高维不完全观察数据上的因果关系推断及其应用

批准号:61572143
批准年份:2015
负责人:蔡瑞初
学科分类:F0607
资助金额:16.00
项目类别:面上项目
2

图模型的结构学习及因果推断

批准号:10771007
批准年份:2007
负责人:耿直
学科分类:A0402
资助金额:18.00
项目类别:面上项目
3

观察性研究中混杂控制的后置/外置辅助变量因果推断模型研究

批准号:81773547
批准年份:2017
负责人:薛付忠
学科分类:H3011
资助金额:65.00
项目类别:面上项目
4

时间序列的因果关系分析与图模型方法研究

批准号:10671044
批准年份:2006
负责人:李元
学科分类:A0402
资助金额:22.00
项目类别:面上项目