The project will fully use the existing genome resequencing data obtained from the Genome Wide Association Study, use the entropy based swarm intelligence heuristic search, data extraction on multiple-clustering, LASSO based high dimensional feature selection to obtain the SNP high-way interaction in whole genome level. Then the entropy maximization strategy will be used to evaluate and validate the obtained candidate high-way interaction, where several transition-based interactions will be pruned. Then the SNPs are mapped into genes in genome. The project will work on incorporating the information of gene ontology, pathway, upstream operon motif, small RNA target gene, and the structure variants caused by SNP, binding-site and docking. All the useful information is unified in the framework of protein interaction network topology variants. The high-way SNP interactions could be validated and illustrated in molecular mechanism in system biology point of view. Then the cropsbreeding and human complex diseases as the experiments datasets will be studied. This project will study and develop a whole set of high-way SNP interaction software and parallel computational platform in whole genome level. Mechanism and data will be incorporated and analyzed. Traits and complex diseases relevant molecular inheritance and metabolism mechanism will be illustrated. The project could also benefit to crops molecular breeding design and complex genome complex traits molecular improvements.
本项目拟充分利用当前用于全基因组关联分析的基因重测序数据,通过采用基于信息熵的群智能启发搜索、基于多聚类的数据压缩、基于LASSO的高维特征选择等策略来挖掘全基因组数据中的高维SNP(核苷酸多态性)相互作用,再使用基于最大化信息熵的方法对其评估,剔除由于传递性导致的间接相互作用。研究由于SNP导致的蛋白结构变化、表面结合位点与docking相关信息,通过映射相关基因,融合基因注释和Pathway信息,在序列上检查启动子motif和小RNA靶基因,并在此基础上研究蛋白相互作用网络中拓扑结构变化。将获得的高维相互作用进行系统生物学层面的信息验证和机理阐述,进行农作物分子育种和复杂人类疾病研究。本项目将提出和研发一套全基因组的高维SNP相互作用挖掘软件和并行计算平台,通过机理与数据的结合与分析,揭示相应性状和复杂疾病相关的分子遗传和代谢机理,为分子育种设计、基因组复杂性状的分子遗传改良提供范例。
本项目拟充分利用当前用于全基因组关联分析的基因重测序数据,通过采用基于信息熵的群智能启发搜索、基于多聚类的数据压缩、基于LASSO 的高维特征选择等策略来挖掘全基因组数据中的高维SNP(核苷酸多态性)相互作用,再使用基于最大化信息熵的方法对其评估,剔除由于传递性导致的间接相互作用。研究由于SNP导致的蛋白结构变化、表面结合位点与docking 相关信息,通过映射相关基因,融合基因注释和Pathway信息,在序列上检查启动子motif 和小RNA 靶基因,并在此基础上研究蛋白相互作用网络中拓扑结构变化。将获得的高维相互作用进行系统生物学层面的信息验证和机理阐述,进行农作物分子育种和复杂人类疾病研究。本项目将提出和开发一套全基因组的高维SNP相互作用挖掘软件和并行计算平台,通过机理与数据的结合与分析,揭示相应性状和复杂疾病相关的分子遗传和代谢机理,为分子育种设计、基因组复杂性状的分子遗传改良提供范例。. 项目组在国内外有影响的学术刊物或国际会议上公开发表高质量学术论文33篇,其中SCI 收录论文29篇,获得发明专利1项,软件著作权7项。完成了一系列基于组学数据的生物信息学模型及其应用软件开发,构建了一系列基于生物序列分析计算模型,完成了一系列生物医学文本挖掘相关算法构建及其应用软件开发,并且进一步构建了一系列的机器学习和模式识别的算法模型,促进了生物信息学的发展。组织国际学术系列会议4次,组织龙星计划课程4次,这些会议和课程的成功举办,不仅为国内外生物信息学、系统生物学、统计遗传学等领域的专家学者、专业人员和研究生提供了一个互相交流的平台,提高了相关研究人员的生物信息学研究水平,也为促进吉林大学与国内外同行在生物信息学研究前沿领域的合作起到了积极的推动作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
基于SSVEP 直接脑控机器人方向和速度研究
基于全基因组重测序的香蕉SNP标记开发及其在种质资源遗传多态性中的应用
基于全基因组重测序和个性化SNP芯片技术挖掘影响绵羊饲料转化率的关键基因
基于全基因组数据的致病SNP位点挖掘
基于全基因组重测序挖掘西双版纳黄瓜优异基因