层次贝叶斯模型中隐性变量分布的非参数估计及在RNA-seq数据中的应用

基本信息

批准号：11401483

项目类别：青年科学基金项目

资助金额：22.00

负责人：司亚卿

学科分类：

依托单位：西南财经大学

批准年份：2014

结题年份：2017

起止时间：2015-01-01 - 2017-12-31

项目状态：已结题

项目参与者：兰伟,周宏伟,胡涛

关键词：

非参数估计RNAseq层次贝叶斯模型数据最大平均效能检验隐性变量

结项摘要

With the recent advent of new technologies such as image detecting, gene sequencing, social media, hierarchical Bayes models have been used more and more widely in the analysis of large datasets. Our proposed project plans to study two-level hierarchical Bayes models, and investigate nonparametric methods of estimating the distributions of latent variables. Nonparametric approaches relay on less prior knowledge of the model, enjoy more flexible forms through data-driven strategies, hence can be applied to more data types than otherwise. We will use spline, kernel and other smoothing techniques to approximate the density functions of latent variables, give rules of choosing the weights as well as the number of base functions, and provide theoretical derivations on the large sample properties of the nonparametric estimates. The new developed method will be compared with previous ones such as empirical Bayes, mixture distribution, Dirichlet process etc. As an important application, hierarchical Bayes model could be used to analyze high-throughput sequencing data, for example, to detect differentially expressed genes from RNA-seq data. We expect that through simulation study and real-data analysis, nonparametric estimation of hierarchical Bayes model will show its advantages compared with previous methods by higher testing power and more precise FDR control. Hence, our proposed research project will have significant theoretically and implementation contribution.

近年随着图像识别、基因测序、社交网络等新技术的革新，对大量数据分析的需要也更加迫切，层次贝叶斯模型因此得到了越来越广泛的应用。本项目拟针对两个层次的层次贝叶斯模型，研究用非参数方法来估计隐性变量的分布。非参数方法依赖于更少的先验知识、提供更加灵活的形式、能够适应更多的数据类型。我们拟使用样条函数、核函数等光滑技术逼近隐性变量的密度函数，将深入研究基函数的个数选择和权重估计问题，证明非参数估计的一致性和其它大样本性质，同时给出计算上高效、可靠的算法。估计的结果将与已有的经验贝叶斯、混合分布、Dirichlet Process等方法作比较。作为一个重要的应用，层次贝叶斯模型可以用来分析高通量测序数据，例如检测RNA-seq数据中的异表达基因，通过仿真实验和真实实验数据的分析来验证用非参数方法估计隐性变量分布的优越性，诸如更高的检测效能和更精确地FDR控制。因此本项目的研究将有重要的理论意义。

项目摘要

近年随着图像识别、基因测序、社交网络等新技术的革新，对大量数据分析的需要也更加迫切，层次贝叶斯模型因此得到了越来越广泛的应用。本项目针对两个层次的层次贝叶斯模型，研究用非参数方法来估计隐性变量的分布。非参数方法依赖于更少的先验知识、提供更加灵活的形式、能够适应更多的数据类型。我们使用样条函数、核函数等光滑技术逼近隐性变量的密度函数，深入研究了基函数的个数选择和权重估计问题，证明了非参数估计的一致性和其它大样本性质，同时给出计算上高效、可靠的算法。估计的结果与已有的经验贝叶斯、混合分布、Dirichlet Process等方法作比较。作为一个重要的应用，层次贝叶斯模型可以用来分析高通量测序数据，例如检测RNA-seq数据中的异表达基因，通过仿真实验和真实实验数据的分析来验证了用非参数方法估计隐性变量分布的优越性，诸如更高的检测效能和更精确地FDR控制。因此本项目的研究将有重要的理论意义。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：

DOI：

发表时间：2020

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：

发表时间：2021

司亚卿的其他基金

相似国自然基金

非参数贝叶斯建模、计算及在类属数据分析中的应用

批准号：61070239

批准年份：2010

负责人：张志华

学科分类：F0605

资助金额：37.00

项目类别：面上项目

基于非参数层次贝叶斯模型的自适应字典稀疏表示方法及应用

批准号：61172179

批准年份：2011

负责人：丁兴号

学科分类：F0116

资助金额：60.00

项目类别：面上项目

贝叶斯统计在追踪研究中的应用

批准号：31800950

批准年份：2018

负责人：刘源

学科分类：C0913

资助金额：20.00

项目类别：青年科学基金项目

贝叶斯柔性密度方法及其在高维金融数据中的应用

批准号：11501587

批准年份：2015

负责人：李丰

学科分类：A0403

资助金额：18.00

项目类别：青年科学基金项目

层次贝叶斯模型中隐性变量分布的非参数估计及在RNA-seq数据中的应用

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

智能煤矿建设路线与工程实践

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

司亚卿的其他基金

相似国自然基金