基因组序列的多样性(包括SNP和CNV)可以影响所在基因的可变剪接,从而导致所在基因的不同疾病易感性。本课题旨在研究由基因组序列的多样性直接量化预测所在基因的疾病易感性。研究内容包括:一,创建一个能够表示单个碱基对其所在基因结构可变性影响程度的指标以及相应的计算方法。每个碱基都将被赋予一个指标值。二,检测该指标值和所在基因结构可变程度(比如可变剪接数量)之间的关系;检测该指标值在不同易感性的SNP或CNV中的分布;从而发展出一套系统以探讨从基因组序列直接判断SNP或CNV导致所在基因的疾病易感性的可能性。本课题的展开将为精确测量基因组序列多样性和基因的疾病易感性的关联提供一个新的量化指标,对进一步理解基因组序列变化和所在基因的易感性之间的关系以及相关疾病的发生发展机理提供一个新的切入点,具有比较重要的理论和实际应用价值。
本项目旨在通过计算基因组序列多样性对基因剪接可变性的影响程度的量化指标,加速我们对理解基因组序列的多样性和基因的疾病易感性之间的关系。主要研究内容和考核指标包括:1. 建立一个精细的SNP和CNV分析系统,该系统可以提供一个精确量化基因组序列变化对基因结构变化影响的指标。2.阐明SNP或CNV的比对质量值,基因可变剪接数之间的关系以及用比对质量值作为一个指标以判断基因疾病易感性的可能性。3. 预计可以发表1-2篇高影响因子的论文;参加多次国内/国际学术交流会议;培养研究生2-4人。. 项目前期通过收集已有的人类EST序列、转录本以及OMIM数据库等数据,分析了基因的疾病易感性与其EST数目的关系以及与转录本数目的关系等。基于已有的转录本数量,在基因是否与疾病相关作为疾病易感性定义时,与疾病相关的基因的可变剪切数目高于与疾病不相关的基因。而与疾病相关的基因集合内,基因的疾病易感性和可变剪切的数目的关系并不明显。另外,通过分析EST序列和基因组序列的比对结果只能分析已有EST支持的基因区域的SNP和CNV对基因可变剪接的影响。由于无法将该方法推广到没有EST序列覆盖的区域,并且得到的结果将会依赖实验结果,我们在项目后期开展了基于基因组序列直接预测基因的可变剪接转录本以减少对实验证据的依赖。目前已经估计出人类基因组编码的转录本数量会超过36万,因此每个人类基因的平均可变剪接数会超过18。通过对这些预测的转录本用高通量RNA-seq测序数据验证,得到了约3万个目前数据库中没有的独特的转录本。基于该可变剪接转录本预测结果,基因的可变剪接数量和疾病易感性之间有一定的正相关。相关论文已经投稿Genome Biology(影响因子9),目前还在审稿中。 . 本项目相关的工作包括二代测序数据分析系统,以及二代测序技术的应用,包括基因调控因子寻找方法等工作。已经发表标注本项目资助的相关核心期刊论文1篇,SCI论文4篇。 . 培养硕士研究生8人(3人毕业);博士生2人。参加国际会议交流9人次。 . 综上所述, 本项目取得了比较丰富的研究结果,超额完成了大部分考核目标。
{{i.achievement_title}}
数据更新时间:2023-05-31
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
敏感性水利工程社会稳定风险演化SD模型
湖北某地新生儿神经管畸形的病例对照研究
时间序列分析与机器学习方法在预测肺结核发病趋势中的应用
甘肃省粗颗粒盐渍土易溶盐含量、电导率与粒径的相关性分析
Imputation法及其在MHC区域易感基因搜寻中的应用
microRNAs及其靶基因遗传变异与湿性老年黄斑变性易感性的分子流行病学研究
基因转录后表达模型的建立及其在人类疾病研究中的应用
利用基因敲除小鼠研究Graves'病相关基因GPR174对免疫调控及疾病易感性的影响与机制