The formation and progression of cancer is closely related to numerous gene mutations. It is widely accepted that sets of genes that are commonly involved in the same cancer pathways tend not to mutate simultaneously in the same patient, which is called as mutual exclusivity of cancer driver mutations. Therefore, the major challenge we have to face is to identify those combinatorial alterations important for cancer development from the heterogeneous cancer genomic mutation data. With increasing numbers of large-scale genomic datasets available, integrating these genomic data to identify driver mutations which are somatic mutations highly related to cancer development become possible. However, it is computationally challenging to identify a specific cancer- driving pathways from genomic mutation data.In order to solve the above problem, we devote to doing reasonable and effective combinatorial methods to study mutual exclusivity of driver mutations. In this project, we will develop an effective and efficient algorithm with its implementation to systematic identification of combinations of driver mutations and driver pathways from somatic mutation data. We then apply our algorithm to analyze somatic mutation data from lung adenocarcinoma patients, lung squamous cell carcinoma patients and known mutations in patients with various cancers.
癌症的发生发展往往与大量基因的突变密切相关。一般而言,同一个癌症驱动通路的多个基因往往不会在同一患者中同时突变,此现象称为癌症驱动突变的排斥性。如何从具有严重异质性的癌症突变数据中识别出与癌症密切相关的且具有排斥性的突变基因组合是当前面临的重大难题。随着大量的大规模基因组数据集的可用,整合这些基因组数据识别那些与癌症发生发展密切相关的体细胞突变(驱动突变)成为可能。如何高效准确地利用这些大数据识别出特定的癌症突变信号通路在计算上仍然是一个巨大的挑战。为了解决上述关键问题,我们将设计合理有效的组合学方法研究突变的互斥性。本项目将对癌症患者数据研究其体细胞突变互斥性的内在机制,设计快速有效的算法及其软件实现对当前大规模的体细胞突变数据进行系统的搜索,识别驱动突变组合及驱动突变信号通路,并运用我们的算法和软件对肺腺癌,肺鳞状细胞癌等各类癌症患者的体细胞突变数据进行分析。
癌症是由多条通路中体细胞突变的积累引起的,其中驱动突变通常在患者体内具有高覆盖率和高排他性的特性。如何从具有严重异质性的癌症突变数据中识别出与癌症密切相关的突变基因组合是当前面临的重大难题。随着大量的大规模基因组数据集的可用,整合这些基因组数据识别那些与癌症发生发展密切相关的体细胞突变(驱动突变)成为可能。如何高效准确地利用这些大数据识别出癌症驱动基因或特定的癌症突变信号通路在计算上仍然是一个巨大的挑战。 取得的重要成果有 (1) 为了充分利用共突变信息,我们在加权基因突变超图模型上提出了一种称为 DriverRWH 的随机游走算法,使用体细胞突变数据和PPI网络数据来识别癌症驱动基因。DriverRWH发现了几个潜在的驱动因素,这些因素在癌症相关通路中富集。同时在肺鳞状细胞癌,浸润性乳腺癌和子宫内膜癌上进行了模型验证。(2)确定参与癌症发展和进展的决定性基因至关重要,对多种癌症的联合分析可能有助于发现不同癌症之间的重叠机制。我们提出了融合基因选择框架FS–GBDT,并对11种人类癌症类型进行了联合分析,以选择稳健和决定性的多癌风险模块和通路。(3)设计了一种名为 MCBFS 的基于多尺度聚类的基因选择算法,可以帮助发现驱动基因,同时我们使用基因表达数据和蛋白质相互作用数据开发了一个名为McbfsNW的通用框架,以确定诊断和治疗疾病的稳健生物标志物和治疗靶点。McbfsNW已应用于肺腺癌。(4)提出了几种预测PPI的计算模型,如PPI-GE、FCTP-WSRC、GRNN-PPI。 他们可以为集成 PPI 网络以识别驱动突变提供技术支持。(5) 开发了几种计算方法来发现潜在的生物医学分子关联,它可以为癌症的诊断和治疗提供帮助。本课题属于数学与应用数学、非线性科学、生物医学、计算机科学等多学科交叉的前沿方向,不仅对生物医学的发展具有重要意义,而且对于相关学科的理论研究和应用有显著促进。希望开发出的模型在未来驱动基因的发现和癌症治疗中发挥重要作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于高通量多组学数据的癌症驱动通路识别算法研究
基于多组学数据整合的癌症驱动突变识别
基于多组学数据的癌症驱动模块网络挖掘方法研究
基于多组学数据整合与深度学习的癌症驱动基因研究