The rapid advances of various high-throughput technologies bring massive amount of gene expression data from different sources with different features. There are many horizontal integrative methods to analyze these gene expression data. How to choose the best integrative method according to different data features is a very important issue. This project compares the integrative methods including mega-analysis and meta-analysis according to different data features using four quantitative statistical evaluation criteria: detection capability, biological association, stability and robustness. This project aims to give the guideline to choose the most suitable method according to the data features in a given application. The major topics include: (1) the suitable data features for data classification; (2) the best criterion of classification for each data feature; (3) the comparability between mega-analysis methods and meta-analysis methods.
高通量基因组技术的发展带来了总量巨大、来源多样、特征多样的基因表达数据,在多源基因表达数据横向整合分析方面有很多不同的统计分析方法,如何针对不同特征的数据选择最佳的整合方法是一个重要的问题。本项目针对不同的数据特征,对不同的原始数据整合方法和结果整合方法从发现率、生物相关性、稳定性、稳健性四个方面进行比较,解决多源基因表达数据横向整合过程中如何针对不同特点的数据选择最为合适的数据整合方法的问题。本项目具体解决三个关键问题:(1)用于分类的数据特征的选择;(2)特定的数据特征的分类标准;(3)原始数据整合方法与结果整合方法之间的可比性问题。
随着高通量基因组技术的发展,基因表达数据呈几何增长,形成了许多基因组数据库,其数据总量非常巨大、数据特征各异。如何综合利用这些海量的多源、多层次的数据进行统计整合分析成为现在的一个研究热点。学者们针对此问题发展了很多不同的数据整合分析方法,如何根据数据的不同特征选择适当的数据整合分析方法成为影响研究结果的一个重要方面。本项目经过筛选,选择数据来源差异性、数据的完整性、数据的加工程度、样本量等数据特征,针对不同特征的数据,对不同的数据整合方法的表现进行比较研究、分析评价,推荐合适的数据整合方法,为实际应用中如何选择合理的数据整合方法提供参考。除此之外,我们在对乳腺癌数据进行共表达网络研究的过程中,得到了比较有价值的分析结果。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
硬件木马:关键问题研究进展及新动向
端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响
基于多源基因表达数据横向整合的流动相关性问题研究
基于多源数据整合的耐药基因识别算法研究
基于多源数据整合的药物组合预测方法研究
多源工程勘察数据统计特征与插值方法研究