Comorbidity refers to the co-occurrence of two diseases disorders or illnesses. Evidences from massive electronic medical records show that many comorbidities exist between diseases, which make people propose that the diseases with comorbidity should share the same underlying mechanism. We confirmed this hypothesis with multilevel data, including sharing biological pathways, sharing genes, direct interactions between proteins encoded by related disease genes and the coexpression between genes associated with comorbidity diseases. Based on this principle, this project plans to explore the underlying mechanisms for those undiagnosed diseases. We first generate comorbidity network by integrating comorbidity pairs extracted from electronic medical records and expanding comorbidity pairs with text mining approach from published papers; we then integrate the disease associated genes with comorbidity network, and identify new disease associated genes with simulation annealing algorithm based on “Guilt by Association ”. We further evaluate the results and eliminate those false positive associated genes with multilevel data from protein interaction network, biological pathway, gene coexpression and disease phenotype network. Last, for each comorbidity pair, we explore their underlying mechanism and identify those new pleiotropic genes associated with comorbidity pair through protein interaction network and biological pathway analysis.
海量临床数据表明疾病之间存在着各种共病现象,即两种疾病共同存在。人们据此提出“具有共病现象的疾病间应具有共同的分子机理”假设。我们利用疾病间共享生物通路,共享基因,对应的蛋白质间的互作以及发生共病现象的疾病基因间的共表达等四个层次证实了这个假设。本项目以此假设为基础,拟对一些病因不明的疾病开展相关分子机制的研究。我们首先整合临床电子病历中的疾病共病关系,利用文本挖掘进一步扩充疾病的共病关系,建立疾病的共病网络。其次将整合的疾病相关基因的数据与疾病共病网络相结合,基于“Guilt By Association”原理,利用模拟退火算法寻找与疾病相关的新基因。随后结合蛋白质相互作用网络,生物途径,基因表达谱,疾病表型网络等多层次数据对挖掘出的与疾病相关的新基因进行更深入的筛选。最后针对每个疾病共病对,基于蛋白质相互作用网络和通路分析来探索其潜在的共病机制,挖掘导致共病现象的具多效性的基因.
本项目以“在临床上共同出现的疾病间具有潜在的共同分子机制”的科学假设为基础开展了系列的工作。首先,我们通过大规模的文本挖掘及多源数据的整合建立了罕见病和儿童疾病的标准化的疾病名称、临床表型和基因型注释体系。随后以此体系为基础,我们利用机器学习方法建立了罕见病的临床诊断辅助体系,为罕见病的快速、精准诊断打下了更好的基础。基于疾病间共享表型和基因等关系,结合蛋白质相互作用和基因表达谱等信息,我们建立了疾病新基因的研究系统,针对成骨不全和先天性脂肪萎缩等疾病发现了一些新的致病基因。我们还根据重度抑郁、双向障碍和精神分裂症三种疾病间具有高的遗传相关性特点,开展了多性状联合的全基因组关联分析,发现了一些新的疾病相关的SNP及致病基因,为解析三种疾病致病机理提供了新的信息。此外,针对药物毒理研究中广泛应用的大鼠转录组不完整的现状我们在整合大规模的大鼠多组织RNA-seq数据和蛋白质组学数据基础上,对大鼠转录组进行了系统地注释,使大鼠转录组注释水平接近小鼠和人的转录组,为药物毒理及疾病机制的研究打下了新的基础。总的来说,我们构建的疾病标准化注释体系为临床大数据的挖掘、疾病的精准诊断和机制研究打下了更好的基础,我们建立的分析方法为疾病的分子机制研究提供了新的思路。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析
针灸治疗胃食管反流病的研究进展
城市轨道交通车站火灾情况下客流疏散能力评价
基于家系的重性精神疾病间发生重叠分子机制研究
自然杀伤细胞和神经干细胞在神经免疫和炎症疾病中的相互作用机制和潜在临床应用
性传播疾病相关支原体感染的临床流行病学研究
复杂疾病高通量数据的多尺度建模与网络分析