基于信息融合的基因集富集度Meta分析方法研究

基本信息
批准号:61202273
项目类别:青年科学基金项目
资助金额:24.00
负责人:张少宏
学科分类:
依托单位:广州大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:Hau-SanWong,张为,唐琳,张汛涞,吴际,邓霞,罗桂联,宋一赞,欧家权
关键词:
基因集富集度分析干细胞信息融合数据Meta分析
结项摘要

Gene set enrichment analysis is one of the most standard bioinformatics approaches to characterize the gene regulatory mechanisms with gene expression data. Moreover, integration of independent studies on the same topics, which is referred to as Meta analysis, is well recognized to improve reliability. However, for gene expression data of cancer stem cells and stem cell derived- cardiomyocytes, it is unpractical to combine various data from different studies to perform effective gene set enrichment analysis, due to the limited numbers of data samples, the rare common genes from various studies, the diversity of various platforms of different studies, and the different importance of data sets. In view of these problems, in this project, we propose to perform gene set enrichment Meta analysis methods based on information ensemble methods with the following novelties: (1) Feature mapping provides effective solution for gene set enrichment Meta analysis on different data and enables the proposed methods to handle multiple-class problems and unsupervised problems while traditional methods can only handle 2-class problems; (2) Data sample similarity measures based on heterogeneous cluster ensembles discriminate the real similarity from the false positive one generated by chances. Our study will provide both improved insight into the gene regulatory mechanisms for the related studies and practical computational approaches for future investigation.

使用基因集富集度分析生物过程中的基因调控机制,是目前公认的标准生物信息学方法,而综合不同独立实验数据的Meta分析方法常被用来提高结果的可靠性。由于目前在干细胞源性心肌细胞和癌症干细胞等相关研究中,各独立研究数据集样本有限、共有基因稀少、平台多样化和数据重要程度不同等特点,传统方法难以奏效。针对上述问题,本课题提出基于信息融合的基因集富集度Meta分析方法,创新之处主要包括:(1)特征映射机制为基因集富集度Meta分析综合处理各独立研究数据提供统一平台基础,同时可将处理范围从传统方法的两类问题推广至多类问题及无监督问题;(2)基于非均匀聚类融合的样本相似性衡量方法,能有效分辨样本真实相似度与随机产生的伪相似度,为样本抽样提供计算依据。本课题提出的研究,为深入了解相关基因调控机制提供重要计算方法和实用信息技术。

项目摘要

本研究项目的结果包括两方面内容:(1)借鉴信息融合技术,基于基因标志列表的多个基因表达数据集的稀缺数据集的基因集Meta分析方法,并应用于干细胞源性心肌细胞;(2)探索部分数据融合的挖掘方法(主要包括约束聚类和聚类融合)和蛋白质作用网络问题,为后续的多源异构基因数据挖掘课题做好准备。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
4

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
5

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021

张少宏的其他基金

相似国自然基金

1

基于基因集富集分析的奶牛全基因组关联分析方法研究

批准号:31000992
批准年份:2010
负责人:王起山
学科分类:C1702
资助金额:20.00
项目类别:青年科学基金项目
2

基于基因集富集分析的奶牛全基因组关联分析方法及其应用研究

批准号:31370043
批准年份:2013
负责人:王起山
学科分类:C1702
资助金额:80.00
项目类别:面上项目
3

Meta分析中若干统计方法的研究及meta分析软件研发

批准号:81273191
批准年份:2012
负责人:陈平雁
学科分类:H3011
资助金额:60.00
项目类别:面上项目
4

多元信息融合的农田土壤孔隙度快速评价方法研究

批准号:31801265
批准年份:2018
负责人:杨玮
学科分类:C1303
资助金额:25.00
项目类别:青年科学基金项目