转录调控关系的识别是理解基因转录调控机理的重要环节。染色质免疫共沉淀实验和微阵列技术是识别转录因子靶基因的两类实验方法,然而它们普遍存在费用高、无法实现高通量识别等缺陷。因此,开发有效的计算预测方法具有重要的实际意义。本项目以模式植物拟南芥为研究对象,以现有的转录调控关系和基因表达数据为基础,利用计算数学、生物信息学的工具开发拟南芥转录因子结合位点和调控关系识别的新方法。内容包括:(1) 研究基因共调控与共表达、功能相似性等之间的关系,改进现有的拟南芥基因共调控聚类方法,并通过motif识别工具的比较与整合,提高对拟南芥motif识别的准确性;(2) 研究转录因子与其靶基因的表达模式关系,综合提取表达谱、序列及结构信息构建拟南芥"转录因子-靶基因"预测的机器学习模型,得到高可信的motif和转录调控数据,并进行实验验证。本项目可以为理解拟南芥转录调控机理、构建基因调控网络提供理论基础。
至2014年12月止,课题组成员已发表相关SCI论文13篇,另有在投及接收论文3篇。其中影响因子在10.0以上的有1篇,3.0以上的7篇。2012年12月至2014年2月,项目负责人赴哈佛大学生物统计与计算生物学系刘晓乐教授课题组进行了为期一年多的学术访问,共同完成高水平研究论文一篇,并确定了长期的合作关系。共培养博士生1名 (于晓庆),硕士生5名(唐琳燕、张君丽、张程、周昶捷、臧东巧)。本项目的主要研究结果包括:.1)拟南芥基因转录调控关系识别方面。我们利用统计学习方法,建立了拟南芥基因“转录因子-靶基因”的预测模型,该模型以基因表达谱、启动子序列特征为输入,利用支持向量机方法进行识别,得到了令人满意的准确度,也得到了新的高可信的转录调控关系以供试验验证。 .2)肿瘤组织甲基化与异质性的研究。刻画出肿瘤组织与其癌旁正常组织的甲基化图谱,并进而进行比较是目前癌症表观遗传研究的核心内容之一。我们建立了癌症-正常混合组织以及癌症多亚群落组织甲基化组的概率模型,并利用极大似然估计和EM算法对模型进行了求解。利用该模型,我们仅通过肿瘤组织的甲基化组数据就可以推测组织中肿瘤细胞的纯度和差异甲基化区域,从而大大降低了差异甲基化分析的实验工作量,并同时提高差异甲基化区域识别的准确性。该成果近期发表在生物学著名期刊《Genome Biology》上。.3)在疾病相关基因预测方面,我们利用蛋白质互作网络、疾病基因关联网络和疾病表型相似性数据构建了疾病与基因关系的多尺度整合网络模型,然后提出了一个基于“有返回随机游动”和“整体拓扑相似性”的致病相关基因预测方法。该方法在交叉验证和从头预测方法均取得了较好的效果。该论文已经发表在计算生物学重要期刊《BMC Bioinformatics》上。.4)蛋白质结构分类、亚细胞定位、功能等方面的研究。我们首次提出利用蛋白质同源比对谱PSI-blast得到的PSSM矩阵出发,分别利用自协方差变化,LPC分解等工具提取特征,既考虑了蛋白质序列中氨基酸次序的信息,也利用了其同源比对谱中蕴含的进化信息。 该方法对包括蛋白质二级结构类预测、凋亡蛋白亚细胞位点预测等模式分类问题上都取得了较好的识别效果。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
基于SSVEP 直接脑控机器人方向和速度研究
内点最大化与冗余点控制的小型无人机遥感图像配准
转录组与代谢联合解析红花槭叶片中青素苷变化机制
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
拟南芥早期热调节基因的转录调控机理研究
拟南芥ACC合成酶基因家族转录和转录后调控网络的研究
拟南芥MTERF家族蛋白调控叶绿体基因转录终止的分子机制
拟南芥转录调控因子WRKY8基因功能分析