基于贝叶斯变量选择的生物标志物筛选方法与策略研究

基本信息
批准号:81373103
项目类别:面上项目
资助金额:16.00
负责人:彭斌
学科分类:
依托单位:重庆医科大学
批准年份:2013
结题年份:2014
起止时间:2014-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:杨晓伟,谢磊,曾庆,夏茵茵,李辉,文雯,徐飞龙,文小焱,唐海霞
关键词:
贝叶斯统计变量选择生物标记物组学数据策略
结项摘要

Biomarker discovery using all types of high-throughput omics data provides a great opportunity for effective diagnosis, treatment and prevention of complex diseases. Nonetheless, the challenge lies in how to find biomarkers from high dimensional omics data sets, which usually have relatively small sample sizes. This challenge is often called the problem of "Large P, Small N". As our literature review suggested, most popularly used methods for biomarker identification are not satisfactory. First, selection strategy via univariate testing (e.g., ANOVA and rank sum test) would ignore the correlational or regulatory relationships between genes. Even though many p-value adjustment schemes have been proposed, the adjustment of multiple testing is not straightforward or explicitly. Second, integrative selection methods (e.g., LASSO and Support Vector Machine) could conduct biomarker identification at a global scope, but they usually work like a "black box", providing little interpretability. As a solution, we propose a Bayesian variable selection (BVS) strategy for biomarker discovery within which informative prior distributions are used for making meaningful selection results. The main aim of this project is to develop the methodology for constructing and formulating informative priors from current study data. In this proposed project, we will further evaluate the validity, accuracy, and efficiency of BVS for biomarker identification using both simulated and practical breast cancer datasets. Accomplishment of this research will provide an integrative biomarker discovery strategy. Our research is expected to offer users an effective statistical methodology for biomarker discovery in the conduct of research on translational medicine. Our BVS strategy for biomarker discovery could greatly enhance the quality of personalized healthcare delivery.

高通量的"组学"(-omics)数据中蕴含着与疾病相关的生物标记物,为深入研究疾病的发生发展机制带来了前所未有的机遇。但是,如何从高维高通量的组学数据中发现生物标记物是生物数据分析的重点和难点。本项目针对目前生物标记物筛选中通用的过滤式(如方差分析、秩和检验等)和封装式(如LASSO,支持向量机等)等方法的局限和不足,提出了一个在贝叶斯变量选择框架下通过集成数据内部结构信息来筛选生物标记物的策略;重点探讨并建立从基因水平结合当前数据所蕴含的特定结构信息(如基因间的关联网络)来筛选生物标记物的平台,以进一步阐明这种"融合"式的筛选策略对生物标记物发现的影响及价值。本项目的成功实施,将对转化医学和分子生物学提供重要的方法论和计算工具,为"个性化医疗"的研发和实施产生明显的促进作用。

项目摘要

高通量的“组学”(-omics)数据中蕴含着与疾病相关的生物标记物,为深入研究疾病的发生发展机制带来了前所未有的机遇。但是,如何从高维高通量的组学数据中发现生物标记物是生物数据分析的重点和难点。本项目针对目前生物标记物筛选中通用的过滤式(如方差分析、秩和检验等)和封装式(如LASSO,支持向量机等)等方法的局限和不足,开发了一个在广义线性模型中基于贝叶斯变量选择的生物分子标记物筛选模型。通过模拟实验,我们探讨了该模型在不同影响因素下的筛选效果;利用高斯图模型挖掘模拟数据内部结构特征并与模型融合,得到了较好的筛选效果;我们还提供了一套从公共生物信息学文献中抽取生物学知识的系统方法;以及对基于LASSO变量选择方法进行了比较研究并提出利用LASSO对我们的贝叶斯筛选方法进行改进的设想。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

祁连山天涝池流域不同植被群落枯落物持水能力及时间动态变化

祁连山天涝池流域不同植被群落枯落物持水能力及时间动态变化

DOI:10.13885/j.issn.0455-2059.2020.06.004
发表时间:2020
3

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
4

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
5

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022

彭斌的其他基金

批准号:51208300
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:31800683
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:71002098
批准年份:2010
资助金额:18.00
项目类别:青年科学基金项目
批准号:81473738
批准年份:2014
资助金额:71.00
项目类别:面上项目
批准号:51675254
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:71703044
批准年份:2017
资助金额:17.00
项目类别:青年科学基金项目
批准号:50501004
批准年份:2005
资助金额:27.00
项目类别:青年科学基金项目
批准号:51902248
批准年份:2019
资助金额:26.00
项目类别:青年科学基金项目
批准号:61471095
批准年份:2014
资助金额:81.00
项目类别:面上项目
批准号:51275226
批准年份:2012
资助金额:84.00
项目类别:面上项目
批准号:81471206
批准年份:2014
资助金额:70.00
项目类别:面上项目

相似国自然基金

1

动态离散选择模型的贝叶斯估计与变量选择

批准号:71501166
批准年份:2015
负责人:茅家铭
学科分类:G0105
资助金额:17.40
项目类别:青年科学基金项目
2

基于贝叶斯变量选择的多数量表型复杂疾病代谢组学巢式设计及统计方法研究

批准号:81302514
批准年份:2013
负责人:张涛
学科分类:H3011
资助金额:23.00
项目类别:青年科学基金项目
3

基于贝叶斯多水平潜变量模型的血糖时变因子构建方法研究

批准号:81402761
批准年份:2014
负责人:孙宏鹏
学科分类:H3011
资助金额:23.00
项目类别:青年科学基金项目
4

基于贝叶斯-Copula理论的高维离散变量相依性研究

批准号:11501355
批准年份:2015
负责人:方艳
学科分类:A0402
资助金额:18.00
项目类别:青年科学基金项目