Complex diseases seriously affect human health and life, it is the essence of the treatment and prevention of complex diseases to understand the complex disease mechanism from the molecular level. Construction the association pathways from genetic variation to complex diseases bridged by genes have become a hotspot and frontier. The variation of genes in different patients is different, but they are often attached to the same differential gene module. Thus, the differential gene module is a "rich ore", which need to urgent develop. In this project, we will propose to construct the association network including pathogenic SNP set, differential gene module and complex disease. Considering the current limitations of this research field, we will propose new mathematical model and optimization strategy for pathogenic SNP set screening to realize the epistatic and high-order SNP interaction detection. Propose new algorithms of genome-wide gene module detection based on heuristic information. Research new methods for the identification of differentially gene modules and a new evaluation standard. Using the cloud computing technology to improve the time acceleration ratio. Research and develop network construction and display platform software, Providing a theoretical model for the construction and analysis of the association network. The aim of this project is to reveal the complex disease mechanism from the global perspective of the network, and to promote the prevention and treatment of complex diseases and the development new drugs, which is of great practical significance and scientific research value.
复杂疾病严重影响人类的健康和生活,从分子层面认知复杂疾病机理是治疗和预防复杂疾病的本质所在。以基因为桥梁构建从遗传变异到复杂疾病间的关联通路成为研究热点和前沿。不同患者基因的变异千差万别,但它们通常隶属于相同差异基因模块。因此,差异基因模块是亟待开发的“富矿”。本项目拟以差异基因模块为中间桥梁,构建包含致病SNP集合、差异基因模块和复杂疾病三者间关联网络。针对当前该领域研究的局限,提出新的致病SNP集合筛选的数学模型和优化策略,实现SNP间上位性及高阶交互作用检测;提出融合启发性信息的全基因组基因模块划分算法;研究差异基因模块识别新方法及其评价新标准;采用云计算技术,提高时间加速比;研发网络构建与展示平台软件,为实现关联网络的构建与分析提供理论模型。本项目旨在从网络全局角度系统揭示复杂疾病机理,助力推动复杂疾病的预防、治疗及新药物的研发,极具现实意义和科研价值。
本项目主要完成的工作包括:特征选择、蛋白质复合物识别、SNP上位性识别、癌症生物标志物识别、蛋白质-配体结合位点预测研究。 发表论文22篇,SCI检索20篇,EI检索2篇,在投6篇。获得授权发明专利3项,申请发明专利一项。. 1.特征选择研究:①LRFS算法。解决忽略标签冗余影响问题。②WRFS算法。填补忽略候选特征相关性空白。③LSMFS算法。解决未区分不同标签关系对特征评估的影响和忽略在不同特征下标签关系的动态变化的问题。④MLSMFS算法。解决忽略提供最大补充信息的关键标签对特征相关性评估的作用问题。 .2.蛋白质复合物识别研究:①SE-DMTG算法。解决忽略具有不同密度和模块的蛋白质复合物问题。②EWCA算法。解决对核-附属蛋白质识别问题。③CALM算法。解决高噪声PPI鲁棒性问题。④MPC-C 算法。解决融合GO-slim数据、网络拓扑结构和基因共表达数据实现权重动态和权重静态相融合的PPI构建问题。.3.SNP上位性识别研究:①HS-MMGKG算法。融合五个函数解决单独衡量SNP组合与疾病关系的函数失效问题。②SEE算法。提高精度减少时间。③SHEIB算法。弥补很少用到生物信息数据库的问题。 .4.癌症生物标志物识别研究:①rfnGMI算法。解决模块动态变化问题。②MGOGP算法。解决忽略基因在功能模块中的作用问题。③BISG算法。解决搜索空间指数增长的问题。④LPRP算法。解决仅捕获一种类型相互作用关系问题。.5.蛋白质-配体结合位点预测研究:①提出基于混合预测思想的蛋白质-RNA结合位点预测方法。②提出基于卷积神经网络的蛋白质-ATP结合位点预测方法。③提出基于卷积神经网络和LightGBM分类算法集成的蛋白质-ATP结合位点预测方法。以上方法解决问题:预测精度提高和样本不平衡。.本项目的研究成果丰富了机器学习理论的应用研究,为生物信息学领域的相关研究提供了新方法和新手段。.
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
跨社交网络用户对齐技术综述
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
城市轨道交通车站火灾情况下客流疏散能力评价
面向全基因组关联的复杂疾病遗传互作网络研究与分析
用计算方法构建全基因组关联复杂疾病基因调控网络
泛全基因组关联分析:人类复杂疾病全基因组关联分析的整合研究
复杂疾病的全基因组SNP互作网络构建与分析