Liver cancer is the third most common malignant tumor, and there is an urgent need for its early detection, diagnosis and treatment. Recently, heterogeneous data generated from genomics, transcriptomics, proteomics and clinical imaging has increased exponentially. Based on these high-throughput data, we will develop methods that can not only integrate different data but also provide biological explanations, to uncover the biological mechanisms and interactions between functional layers of liver cancer more accurately. These methods can be used to describe and predict biological functions, phenotypes and behaviors in the life process related to liver cancer, and discover cancer biomarkers. In this project, we will develop integration methods of multi-group data from following three aspects: (1) explore the correlations between multi-omics data based on sparse typical association analysis; (2) construct biomacromolecule interaction networks based on sparse graph model and use network integration methods to construct synthetic biology network; (3) discover the hidden components of high-dimensional multi-group data based on sparse nonnegative tensor decomposition to establish the relationships between these data. Then we develop software platform for above three methods to analyze multi-group data of liver cancer and explore cancer biomarkers, thus provide theoretical support for further accurate diagnosis and treatment of liver cancer.
肝癌是我国第三大常见恶性肿瘤,它的早期发现、诊断和治疗刻不容缓。当今,基因组、转录组、蛋白质组及各种临床影像等异质多模态数据呈指数级增长,在这种高通量数据背景下,为了更准确地揭示肝癌发病时的生物学机制及各功能层之间的相互作用,我们拟开发整合各种模态数据同时给出生物学解释的方法,从而可以描述和预测肝癌相关生命过程的生物学功能、生物体表型和行为,发现肝癌相关标识物。本课题将主要从以下三个方面建立多模态数据整合方法:(1)基于稀疏典型关联分析探索不同组学数据之间的关联性;(2)基于稀疏图模型建立生物大分子相互作用网络,并用网络整合方法构建综合生物学网络;(3)基于稀疏非负张量分解发现高维多模态数据的隐含成分以建立不同模态数据之间的相互关系。并开发基于上述三种整合方法的软件平台,分析肝癌多模态数据,探索肝癌标识物,进一步为肝癌的精准诊断和治疗提供理论支持。
我国肝癌的发病率,死亡率高居高不下。为了更好的治疗它,更早的发现、诊断是必要的。而此时各种高通量组学数据的爆发式增长,为了我们提供了这种可能性。因此,我们拟开发整合各种模态数据同时给出生物学解释的方法,从而可以描述和预测癌症相关生命过程的生物学功能、生物体表型和行为,发现肝癌相关标识物。本课题将主要从以下四个方面建立多模态数据整合方法:.(1)基于张量分解模型,我们提出了LSUE方法中,我们将不同的细胞类型、转录因子和基因组位置直接投影到欧式空间,使其相互作用关系可以直接通过几何运算完成,通过逐对相互作用张量被融合在一起。.(2)基于凸优化和结构稀疏理论,我们提出了提出一种网络驱动的从DNA甲基化位点到基因,再从基因到疾病的关联映射方法;.(3)将弱监督学习和支持向量机进行结合来挖掘潜在的模体;.(4)基于深度学习方法,我们将RNA结构数据和DNA形状数据应用于模体挖掘任务中,例如iCapsule方法,该方法同时使用了RNA序列特征和RNA结构特征. 项目组已在IEEE/ACM transactions on computational biology and bioinformatics、 PloS One、IEEE transactions on nanobioscience等国际期刊和本领域重要的国际会议(ICIC等)上发表论文46篇,其中期刊发表论文28篇,会议论文18篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于多源数据整合的药物组合预测方法研究
基于结构约束的多模态学习理论和方法
基于多模态数据对抑郁症自杀倾向的预测研究
基于多组学数据整合的疾病基因预测方法研究