With the ever-increasing pace of synthetic biology, there is a more and more urgent demand for fast and accurate computational tools to identify regulatory motifs and essential genes automatically. Essential genes are genes that are indispensable to support cellular life. These genes constitute a minimal gene set required for a living cell. The regulatory motifs (such as: promoters, terminators, etc) largely account for the expression level of the corresponding genes, and further largely account for the response of gene circuits or gene networks. The main topics are developing new efficient methods to predict regulatory motifs and essential genes. Moreover, prerequisite of prediction precision, the research is aiming at reduce the memory and time requirements of the methods. So advanced algorithms would be used and proposed. Furthermore, regulatory dynamics of gene circuits, including stability, robustness, and so on, would be researched using Chaos and other nonlinear dynamic theories and methods. And then making good use of modularization and hierarchical concepts of synthetic biology, regulatory dynamics of comparatively more complex gene networks would be researched. Our work are hopefully finding out new ideas and new methods to improve the development of synthetic biology.
随着基因组测序和基因合成技术的迅速提高,对基因组序列分析提出了更高的要求。而合成生物学的飞速发展和应用,更是对基因调控部件(启动子、终止子、转录因子结合位点等)的序列识别、调控机理研究以及必需基因的研究提出了新的迫切要求。本项目充分利用Z曲线等生物信息学方法,利用先进的机器识别技术开发新的算法,提高细菌基因组调控区域DNA序列和必需基因识别算法的精度。在保证识别精度的基础上,运用各种先进算法降低程序在运行时间和空间方面的要求。研究调控区域DNA序列、密码子序列等与基因必需性之间的关系,同时充分利用合成生物学工程化的思想和模块化、层次化的设计思路,从基因调控网络的全局角度分析调控部件调控能力的变化对调控网络鲁棒性、稳定性等重要性能的影响规律,为合成生物学的工程化和广泛应用开辟新方法,寻找新思路。
充分利用先进的机器识别技术,利用合成生物学工程化的思想和模块化、层次化的分析思路,开发新的算法和分析软件,提高细菌基因组调控区域DNA序列、微生物必需基因识别算法的精度和人类癌症相关特征基因的识别。主要工作包括:1)提出了新的原核生物必需基因识别的新方法: ZEPLS,实现原核生物必需基因的交叉物种识别和预测。 2)提出了一种新的IASPLS 算法, 大大提高了微生物短基因序列识别的精度和速度,为短序列必需基因的识别提供了必要的研究手段;3)针对DNA数据的特性和癌症相关特征基因的生物医学特性,提出新的SPDF算法,提高白血病和肠癌相关特征基因的识别精度4)基于国际公认的NCI-60癌症细胞系的基因表达数据,结合机器学习算法,建立了精确的肿瘤细胞辐射敏感性的非线性预测模型;5)以世界上应用最广泛的TCGA癌症数据为例,首次提出综合基因表达数据和甲基化数据的全基因组数据分析,利用先进的模式识别算法 识别出正确区分肺腺癌和肺鳞状细胞癌的特征基因;6)创新性地组合应用四种特征基因筛选方法,分别从特异性 、相关性、生物功能和对肿瘤分类模型的贡献等多个方面,通过迭代降维技术递归筛选与肺鳞状细胞癌发生和发展密切相关的特征 基因;7)首次从迭代多重筛选方法等多个角度对全基因组甲基化数据进行多步筛选,识别吸烟与肺腺癌发展相关的特征基因。上述对人类癌症相关特征基因的识别,不仅大大缩小了人类必需基因的搜索范围 ,同时也为调控基元和必需基因研究早日应用于“精准治疗”等临床实践中提供重要的分析手段和理论依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
放射诱导内皮细胞源Microvesicles通过TGF-β/Smad信号通路介导口腔癌放疗抗性的研究
支原体的必需基因识别与核心基因组分析
基于序列特征和统计判别方法发展细菌必需基因识别算法及软件
基于集成模型的细菌必需基因识别算法研究及应用
微生物必需基因集与联合致死基因集的理论分析与识别研究