基于贝叶斯变量选择的生物标志物筛选方法与策略研究

基本信息

批准号：81373103

项目类别：面上项目

资助金额：16.00

负责人：彭斌

学科分类：

依托单位：重庆医科大学

批准年份：2013

结题年份：2014

起止时间：2014-01-01 - 2014-12-31

项目状态：已结题

项目参与者：杨晓伟,谢磊,曾庆,夏茵茵,李辉,文雯,徐飞龙,文小焱,唐海霞

关键词：

贝叶斯统计变量选择生物标记物组学数据策略

结项摘要

Biomarker discovery using all types of high-throughput omics data provides a great opportunity for effective diagnosis, treatment and prevention of complex diseases. Nonetheless, the challenge lies in how to find biomarkers from high dimensional omics data sets, which usually have relatively small sample sizes. This challenge is often called the problem of "Large P, Small N". As our literature review suggested, most popularly used methods for biomarker identification are not satisfactory. First, selection strategy via univariate testing (e.g., ANOVA and rank sum test) would ignore the correlational or regulatory relationships between genes. Even though many p-value adjustment schemes have been proposed, the adjustment of multiple testing is not straightforward or explicitly. Second, integrative selection methods (e.g., LASSO and Support Vector Machine) could conduct biomarker identification at a global scope, but they usually work like a "black box", providing little interpretability. As a solution, we propose a Bayesian variable selection (BVS) strategy for biomarker discovery within which informative prior distributions are used for making meaningful selection results. The main aim of this project is to develop the methodology for constructing and formulating informative priors from current study data. In this proposed project, we will further evaluate the validity, accuracy, and efficiency of BVS for biomarker identification using both simulated and practical breast cancer datasets. Accomplishment of this research will provide an integrative biomarker discovery strategy. Our research is expected to offer users an effective statistical methodology for biomarker discovery in the conduct of research on translational medicine. Our BVS strategy for biomarker discovery could greatly enhance the quality of personalized healthcare delivery.

高通量的"组学"（-omics）数据中蕴含着与疾病相关的生物标记物，为深入研究疾病的发生发展机制带来了前所未有的机遇。但是，如何从高维高通量的组学数据中发现生物标记物是生物数据分析的重点和难点。本项目针对目前生物标记物筛选中通用的过滤式（如方差分析、秩和检验等）和封装式（如LASSO，支持向量机等）等方法的局限和不足，提出了一个在贝叶斯变量选择框架下通过集成数据内部结构信息来筛选生物标记物的策略；重点探讨并建立从基因水平结合当前数据所蕴含的特定结构信息（如基因间的关联网络）来筛选生物标记物的平台，以进一步阐明这种"融合"式的筛选策略对生物标记物发现的影响及价值。本项目的成功实施，将对转化医学和分子生物学提供重要的方法论和计算工具，为"个性化医疗"的研发和实施产生明显的促进作用。

项目摘要

高通量的“组学”（-omics）数据中蕴含着与疾病相关的生物标记物，为深入研究疾病的发生发展机制带来了前所未有的机遇。但是，如何从高维高通量的组学数据中发现生物标记物是生物数据分析的重点和难点。本项目针对目前生物标记物筛选中通用的过滤式（如方差分析、秩和检验等）和封装式（如LASSO，支持向量机等）等方法的局限和不足，开发了一个在广义线性模型中基于贝叶斯变量选择的生物分子标记物筛选模型。通过模拟实验，我们探讨了该模型在不同影响因素下的筛选效果；利用高斯图模型挖掘模拟数据内部结构特征并与模型融合，得到了较好的筛选效果；我们还提供了一套从公共生物信息学文献中抽取生物学知识的系统方法；以及对基于LASSO变量选择方法进行了比较研究并提出利用LASSO对我们的贝叶斯筛选方法进行改进的设想。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.13885/j.issn.0455-2059.2020.06.004

发表时间：2020

DOI：

发表时间：2017

DOI：

发表时间：2016

DOI：10.16085/j.issn.1000-6613.2022-0221

发表时间：2022

彭斌的其他基金

批准号：51208300

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：31800683

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：71002098

批准年份：2010

资助金额：18.00

项目类别：青年科学基金项目

批准号：81473738

批准年份：2014

资助金额：71.00

项目类别：面上项目

批准号：51675254

批准年份：2016

资助金额：60.00

项目类别：面上项目

批准号：71703044

批准年份：2017

资助金额：17.00

项目类别：青年科学基金项目

批准号：50501004

批准年份：2005

资助金额：27.00

项目类别：青年科学基金项目

批准号：51902248

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：61471095

批准年份：2014

资助金额：81.00

项目类别：面上项目

批准号：51275226

批准年份：2012

资助金额：84.00

项目类别：面上项目

批准号：81471206

批准年份：2014

资助金额：70.00

项目类别：面上项目

相似国自然基金

动态离散选择模型的贝叶斯估计与变量选择

批准号：71501166

批准年份：2015

负责人：茅家铭

学科分类：G0105

资助金额：17.40

项目类别：青年科学基金项目

基于贝叶斯变量选择的多数量表型复杂疾病代谢组学巢式设计及统计方法研究

批准号：81302514

批准年份：2013

负责人：张涛

学科分类：H3011

资助金额：23.00

项目类别：青年科学基金项目

基于贝叶斯多水平潜变量模型的血糖时变因子构建方法研究

批准号：81402761

批准年份：2014

负责人：孙宏鹏

学科分类：H3011

资助金额：23.00

项目类别：青年科学基金项目

基于贝叶斯-Copula理论的高维离散变量相依性研究

批准号：11501355

批准年份：2015

负责人：方艳

学科分类：A0402

资助金额：18.00

项目类别：青年科学基金项目

基于贝叶斯变量选择的生物标志物筛选方法与策略研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

玉米叶向值的全基因组关联分析

祁连山天涝池流域不同植被群落枯落物持水能力及时间动态变化

论大数据环境对情报学发展的影响

监管的非对称性、盈余管理模式选择与证监会执法效率?

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

彭斌的其他基金

基于贝叶斯推断的砌体结构多尺度数值模拟和性能预测

在DNA损伤应答中Polo样激酶1（PLK1）活性调控的分子机制

组合奇异期权定价及在跨国理财中运用机理的研究

复聪片干预SIRT2及F0XO3a信号通路延缓C57BL/6J小鼠听力减退的机制研究

局部变截面无油涡旋压缩机的热动力耦合特性研究

大维面板数据模型中存在序列相关性的截面相关性检验研究

应力对FeCoSiB非晶磁弹性薄膜磁特性影响的研究

低磁阻尼外延多铁异质结中电压调控自旋泵浦效应研究

NM1/FM/NM2结构中自旋泵-逆自旋霍尔效应研究

基于混合协同智能算法的变截面涡旋膨胀机集成优化研究

颅内动脉粥样硬化性狭窄性疾病中脑血管新生作用研究

相似国自然基金