为了理解小鼠生精过程的内在机理,发现生精过程中功能显著的基因是其关键问题。本项目以GeneRank算法为基础,结合机器学习方法来实现小鼠生精过程重要基因的筛选和功能预测,并辅以生物学实验来验证。(1)以基因表达谱数据为主,融合基因序列、蛋白相互作用、文献数据等可用数据源,采用多种机器学习方法,包括非监督的非负矩阵/张量分解、流形学习、有监督与半监督学习算法等,来构建基因之间的相互关系网络,用GeneRank算法实现显著基因的筛选;(2)筛选出100-200个显著基因,利用各种有监督和半监督机器学习算法实现基因的功能分类预测;(3)选择50~100个显著基因,采用实时定量RT-PCR等生物学方法验证其在小鼠生精过程中的mRNA和蛋白质的表达等功能。本项目对理解生精过程、生殖健康等具有重要意义,对其它生物过程或疾病的基因筛选和功能预测也具有参考价值。
生精过程是一个复杂的细胞分化阶段,参与其中的重要基因与一系列阶段性的细胞事件密切相关。目前各种先进的生物工程技术获得了许多与生精过程及成熟相关的基因的数据信息。在后基因组时代,有关生精过程的各种海量数据和文献资料呈指数级增长,如何从中筛选和鉴定整个生精过程中起重要作用的特异性基因,并对这些基因的表达特性及其在生精过程中所起的生物学功能进行深入的研究,对理解生精过程的内在机理具有重要的意义。在本项目的研究过程中,我们融合GeneRank算法和状态空间模型、矩阵和张量分解、聚类分析等相关的机器学习方法,提出了显著基因筛选算法,并应用在小鼠生精过程中的高通量基因表达谱数据上,进行大规模地筛选具有显著功能的基因,并通过文献进行了验证。这对生精过程中基因功能研究、通路研究等基础和临床应用具有重要的科研意义和参考价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
关于新型机器学习方法实现链接预测任务的研究
印记基因的机器学习方法预测及候选印记基因的实验鉴定及功能分析
基于定量结构图实现软件系统自治功能的机器学习方法
基于“肾藏精”理论研究补肾填精法调控小鼠精原干细胞增殖及改善少弱精子症小鼠生精功能的作用及机制