二代测序技术下转录组组装软件的开发

基本信息
批准号:31000588
项目类别:青年科学基金项目
资助金额:18.00
负责人:阮珏
学科分类:
依托单位:中国科学院北京基因组研究所(国家生物信息中心)
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:杜政霖,陶勇,李春燕,崇泽臣,王瑜,徐锦,李倩倩
关键词:
组装转录组新测序技术
结项摘要

近二十年来,基因组学和生物信息学取得了飞速的发展,为研究非模式生物提供了方法学和理论支持。转录组测序是目前在未知基因组物种中大规模获取编码基因序列的较为有利的手段,结合二代测序技术后,提供了在合理费用下研究非模式生物编码基因的便捷方案。然而,当前通过转录组测序组装出的DNA片段过于零碎,大大限制了对非模式生物编码基因的认识。转录组组装受两个主要因素制约:1,转录区域的复杂度;2,转录区域的不均一性。本课题将利用新测序技术逐渐增加的测序序列长度,以及成对序列的信息来提高组装出基因片段的长度和准确性,并开发出解决新测序技术下转录组组装的软件。该软件将支持多个测序平台的数据;较好地支持50bp之上的短序列;对不同表达量的基因区分组装,提高低表达基因的组装效果;使用更多信息识别基因的不同剪切方式。

项目摘要

二代测序技术给基因组学和生物信息学带来了巨大的机遇和挑战。本项目旨在开发算法和软件来解决二代测序技术中的组装问题:序列读长、错误率以及大数据量。针对这个问题我们做了如下开发:1,短序列聚类组装;2,虚拟长序列构建。技术开发1面向海量短序列的聚类问题。我们使用了成块的间隔种子作为索引寻找序列间的相似度,然后利用类似深度测序中寻找杂合子的策略来对所有相似的序列进行细分类。细分类的结果可能会将基因组同一区域的序列分隔成多个子类,因此我们最后利用生成树来融合杂合子造成的子类,从而形成正确的短序列聚类结果。该技术目前已经广泛应用于RAD测序的数据分析中。技术开发2面向双向测序序列的组装。基本思路是正确填充双向测序序列内部未测序的空洞部分,从而获得完整的长的序列,大大提高组装的结果。给定一对双向序列,我们通过比对得到和双向序列存在重叠的其他双向序列,也即聚类。然后将聚类获得的所有可能落在局部区域的序列进行局部组装,就得到了给定双向序列的完整序列。该方法有三个优点:a,增加序列读长,从100bp增加至600bp;b,纠正测序错误,在局部组装中测序错误得到了校正;c,在局部组装中也能够识别出杂合子。我们开发了对应于上述两个新技术的软件rainbow和anytag,并发表于Bioinformtics和BMC Genomics上。本项目的研发成果能够有效地提升二代测序技术下的RAD组装和全基因组装效果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:
5

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020

阮珏的其他基金

批准号:31571353
批准年份:2015
资助金额:57.00
项目类别:面上项目

相似国自然基金

1

复杂基因组的三代测序技术组装算法和软件研发

批准号:31571353
批准年份:2015
负责人:阮珏
学科分类:C0608
资助金额:57.00
项目类别:面上项目
2

基于第二代测序技术的松果体转录组的昼夜节律研究

批准号:31401080
批准年份:2014
负责人:付聪
学科分类:C0607
资助金额:24.00
项目类别:青年科学基金项目
3

基于高通量测序和从头组装的癌症基因组变异位点检测方法和软件开发

批准号:31371281
批准年份:2013
负责人:李瑞强
学科分类:C0607
资助金额:70.00
项目类别:面上项目
4

转录组进化分析的统计学框架及软件开发

批准号:31571355
批准年份:2015
负责人:谷迅
学科分类:C0608
资助金额:63.00
项目类别:面上项目