高准度二代测序比对算法

基本信息
批准号:31501067
项目类别:青年科学基金项目
资助金额:19.00
负责人:王一
学科分类:
依托单位:复旦大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:李艳红
关键词:
计算模型模拟参数优化软件开发
结项摘要

Second-generation sequencing technology is one of the fundamental technology in future life science. Conventional Second-generation sequencing analysis process is inseparable from the basic read alignment step. The quality of this step plays a key role in the quality of the final analysis results. Existing alignment algorithms have certain false-negative and false-positive rates as well as the systemic bias, compromising the reliability of the subsequent analysis. This study will develop its own sequence alignment algorithm to achieve lower false-negative and false-positive rates as well as lower systematic bias, taking into consideration of the speed. This study proposes to work in three steps: First, a systematic review of previous work and refine their consensus framework and technical features. Make full use of the advantages of a long read length, write its own alignment algorithms. And finally benchmark on the simulated data and real data, to get the proper evaluation of the algorithm and the application experience. At present, there are certain elementary framework of the subject, preliminary experiments show that the algorithm can reduce the error rate, while maintaining a high speed. Follow-up studies will focus on algorithms speed and algorithms maturing, in order to achieve industrial level application.

二代测序是未来生命科学领域的基础性技术之一。二代测序的常规分析流程都离不开序列比对这一基础步骤。序列比对步骤的质量对二代测序数据分析结果起着关键性的作用。现有的比对算法存在着一定的比对假阴性率和假阳性率以及系统性偏差,影响了后续分析的可靠性。本课题将自行开发一套序列比对算法,以期达到低比对假阴性率和假阳性率以及系统偏差,同时兼顾比对速度。本课题拟在三方面开展工作:首先系统化回顾前人工作,提炼其共有框架和特色技术,然后充分利用长读长的优点,编写自主的比对算法,最后在模拟数据和真实数据上进行系统化测评,取得对该算法的正确评价以及实际使用经验。目前该课题已有一定基础框架,初步试验表明该算法可以降低比对错误,同时维持较高比对速度。后续研究将集中在算法速度提升和算法成熟化上,以期达到工业级别实际应用能力。

项目摘要

随着二代测序的日渐成熟和数据量增大,快速准确的序列比对日渐重要。本课题通过研究序列比对算法,开发出具有实用价值的序列比对软件。该软件比对准确率接近主流的BWA-MEM,比对速度是BWA的6倍,而且使用该软件比对之后的突变检出准确性达到目前最好。该软件已经开源发表,受到国外计算机领域专家的肯定。本项目还超额完成了一个SNP/INDEL calling算法和一个聚类算法,都已经发表。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019

王一的其他基金

批准号:21403183
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:11501458
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:51505125
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:81270996
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:30872833
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:30171046
批准年份:2001
资助金额:17.00
项目类别:面上项目
批准号:10904024
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:31500732
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

基于比对转录组测序的苦荞籽粒高黄酮形成关键基因的筛选及功能验证

批准号:31701494
批准年份:2017
负责人:李洪有
学科分类:C1307
资助金额:26.00
项目类别:青年科学基金项目
2

基于二代测序的视网膜变性基因研究

批准号:81470669
批准年份:2014
负责人:睢瑞芳
学科分类:H1305
资助金额:73.00
项目类别:面上项目
3

二代测序技术下转录组组装软件的开发

批准号:31000588
批准年份:2010
负责人:阮珏
学科分类:C0608
资助金额:18.00
项目类别:青年科学基金项目
4

基于二代测序的小细胞肺癌放化疗抵抗机制研究

批准号:81672972
批准年份:2016
负责人:陈明
学科分类:H1824
资助金额:57.00
项目类别:面上项目