高通量数据和深度学习在基因调控层次网络构建中的应用研究

基本信息
批准号:61702058
项目类别:青年科学基金项目
资助金额:19.00
负责人:张永清
学科分类:
依托单位:成都信息工程大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:李孝杰,彭静,刘鹏,唐明轩,李煜,杨璐,陈胜娣
关键词:
基因调控网络多模态深度学习高通量数据
结项摘要

Gene regulatory networks (GRNs) are a multi-layer complex physiological process and one of the most important means to understand the function of genes. With the development of high-throughput sequencing technology, it has produced massive genomics data. How to deeply study the method of GRNs and its biological significance with integrates high-throughput data has become the hot and difficult current research. According to the characteristics of high-throughput data, based on the deep learning technology, we try to carry out some specific research: (1) To effectively reduce the high false positive rate in the existing prediction algorithm, we will present a higher accuracy transcription factor binding site prediction algorithm with the convolution neural network and the recurrent neural network method. (2) We try to propose new GRNs algorithm based on the multimodal deep learning method and integration with gene expression data, transcription factor binding site, histone modification and protein interaction. (3) We will analysis the important biomarkers with the disease based on the cancer genome data and proposed algorithm, to explore the molecular mechanism of disease. This project will provide new research methods and ideas for systems biology and computational biology and also will advance our understanding and research on the mechanisms of gene regulation of complex diseases.

基因调控网络是一个多层次复杂的生理过程,是理解基因功能的最重要手段之一。随着高通量测序技术发展,产生了海量的基因组学数据,如何进一步整合高通量数据,深入研究基因调控层次网络构建方法及其生物学意义,成为了当前研究的热点与难点。针对高通量数据的各自特点,基于深度学习方法,本项目拟研究:(1)基于卷积神经网络和递归神经网络方法,提出一种准确度更高的转录因子结合位点预测算法,有效降低现有预测算法中普遍存在假阳性率偏高的问题;(2)基于多模态深度学习方法,结合基因表达、转录因子结合位点、组蛋白修饰和蛋白质相互作用等数据,提出一种新的基因调控层次网络构建算法,并分析各组学数据对网络构建的影响;(3)基于癌症基因组数据和所提出的网络构建算法,挖掘疾病关联的重要生物标记,探索疾病分子机理。本项目将为系统生物学和计算生物学领域提供新的研究方法和思路,并将推进我们对复杂疾病的基因调控机制的深入理解和研究。

项目摘要

基因调控网络构建是生物网络研究的重要组成部分,对从本质上认识基因的功能和生命活动机理,为疾病的治疗和相关药物的研发具有重要的作用。按照项目计划,通过基于高通量数据和深度学习在基因调控层次网络构建中的理论和方法,提出了一种结合卷积神经网络和长短时记忆神经网络混合的深度学习模型预测DNA-蛋白质结合位点,提升了转录因子结合位点的识别准确率。针对生物信息数据中的不平衡问题,提出了一种结合皮尔逊相关系数的最大相关最小冗余监督学习算法,挑选生物信息数据中负样本的伪负样本问题,提升了数据的分类效果。此外,通过ADASYN对正样本的过采样和Bootstrap对负样本的欠采样策略,提出了一种解决DNA-蛋白质结合位点中不平衡分类问题。基于规则化随机森林算法和多数据融合策略,探讨了基因调控网络的构建和肌肉浸润性膀胱癌亚型基因调控网络分析。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

张永清的其他基金

批准号:30930033
批准年份:2009
资助金额:180.00
项目类别:重点项目
批准号:30771453
批准年份:2007
资助金额:30.00
项目类别:面上项目
批准号:51072197
批准年份:2010
资助金额:37.00
项目类别:面上项目
批准号:30430250
批准年份:2004
资助金额:130.00
项目类别:重点项目
批准号:51572089
批准年份:2015
资助金额:64.00
项目类别:面上项目
批准号:30871483
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:31571604
批准年份:2015
资助金额:60.00
项目类别:面上项目
批准号:41803047
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目

相似国自然基金

1

深度学习在江门中微子实验顶点重建中的应用

批准号:11805294
批准年份:2018
负责人:李紫源
学科分类:A2806
资助金额:29.00
项目类别:青年科学基金项目
2

基于高通量数据的基因调控网络构建模型和方法研究

批准号:61402457
批准年份:2014
负责人:张秀军
学科分类:F0213
资助金额:24.00
项目类别:青年科学基金项目
3

深度学习技术在BESIII的应用研究

批准号:U1732103
批准年份:2017
负责人:刘北江
学科分类:A3201
资助金额:62.00
项目类别:联合基金项目
4

半监督深度学习算法及其在时序数据预测上的应用研究

批准号:61806125
批准年份:2018
负责人:屠恩美
学科分类:F0603
资助金额:27.00
项目类别:青年科学基金项目