面向异构并行系统的生物序列比对并行策略及算法研究

基本信息

批准号：61173013

项目类别：面上项目

资助金额：58.00

负责人：周炎涛

学科分类：

依托单位：湖南大学

批准年份：2011

结题年份：2015

起止时间：2012-01-01 - 2015-12-31

项目状态：已结题

项目参与者：黎福海,朱青,姜燕,贺再红,高剑,朱香元,张舜,邱熙

关键词：

序列比对并行算法异构并行系统

结项摘要

序列比对是生物信息学中重要的基本问题,是生物信息学的基础,可用来预测序列的功能、结构和进化过程等. 随着大规模测序技术日益成熟,序列数据呈指数级增长,使得现有序列比对并行策略中存在的可扩展性问题日益突出.同时,现有的序列比对并行策略多使用同构系统求解,且极少采用数据并行方案. 随着高性能计算系统快速发展,应用异构并行系统求解各类NP难解问题已变得越来越普及和流行. 本项研究将在异构并行系统中求解序列比对问题.首先提出一种异构并行系统计算能力描述模型,然后设计基于聚类的新的数据并行策略,最后通过0-1整数规划求解并行调度最优解,并设计近似最优的启发式算法.本项研究不仅为生物序列比对基于异构超级计算机的并行化策略和方法奠定基础,为生物信息学中数据密集应用提供高性能计算解决方法,还将拓宽超级计算机应用领域,推动生物信息学的研究与发展.

项目摘要

面向异构并行系统的序列比对并行策略研究，不仅设计异构并行系统计算能力描述模型，还为序列比对的并行策略和算法设计提供新思路，从而为生物信息学的更广泛应用奠定基础；同时还将丰富传统并行处理的研究内容，推动生物信息学和高性能计算与超级计算机系统的研究与发展。.本项目（1）针对序列比对算法的可扩展性问题，提出基于分治法的序列比对通用算法(DCPA)。通过将大规模序列集分割成能被现有算法处理的小的序列子集，在多核计算机实现大规模序列数据的处理。分别使用基准多序列比对库和大规模序列集测试DCPA算法的性能。实验结果表明，相对于经典的序列比对算法MUSCLE，DCPA获得了近111倍的性能加速，且维持较好的比对精度。.（2）进一步研究序列集分割策略，提出基于数据并行的序列比对算法(CDAM)。CDAM算法应用聚类方法分割序列集，设计最长处理时间优先算法(LPT)分发序列子集，以及设计渐进式序列子集合并策略获得大规模序列集的比对结果。分别应用Cd-hit，UCLUST，SiLiX，CLUSS和BLASTClust等5种聚类算法到CDAM的序列集分割阶段。实验结果表明：在这5种应用不同聚类方法的CDAM程序中，CDAM(UCLUST)和CDAM(Cd-hit) 整体性能良好。相对于经典的序列比对算法MUSCLE，它们分别获得了151倍和111倍的性能加速，损失了2.19%和2.87%的比对精度。.（3）提出基于CPU+GPU异构系统的MAFFT序列比对并行算法。分别在NVIDIA Tesla C2050、Tesla M2090和Tesla K20m GPU上测试基于异构系统的MAFFT序列比对并行算法。与串行和多线程MAFFT算法相比，在维持相同比对精度的同时，在Tesla K20m GPU上分别获得了56.7和7.1的性能加速。.（4）提出一种新的多序列比对算法(CROMSA)。使用基准多序列比对库测量CROMSA的比对精度和计算复杂度。实验结果表明，CROMSA在比对精度上优于本文提出的DCPA、CDAM(Cd-hit)、和CDAM(UCLUST)。由于需要花费较长时间来优化比对结果，CROMSA较这些算法比对时间长。但相对于当前其他流行算法ProbCons和MUMMALS，CROMSA具有明显的比对时间优势，进一步地说明了应用化学优化方法求解序列比对问题的有效性。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：DOI: 10.11821/dlxb201611003

发表时间：2016

DOI：

发表时间：2017

周炎涛的其他基金

批准号：61472126

批准年份：2014

资助金额：82.00

项目类别：面上项目

相似国自然基金

大规模生物序列比对及其基于异构系统的并行处理技术研究

批准号：61402400

批准年份：2014

负责人：朱香元

学科分类：F0213

资助金额：25.00

项目类别：青年科学基金项目

面向多核异构并行系统的随机调度策略与算法研究

批准号：61070057

批准年份：2010

负责人：李肯立

学科分类：F0202

资助金额：33.00

项目类别：面上项目

基于异构平台的高复杂度生物序列分析算法并行化研究

批准号：61202127

批准年份：2012

负责人：夏飞

学科分类：F0204

资助金额：24.00

项目类别：青年科学基金项目

生物序列分析的高效并行算法研究

批准号：60273007

批准年份：2002

负责人：郑纬民

学科分类：F0204

资助金额：24.00

项目类别：面上项目

面向异构并行系统的生物序列比对并行策略及算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

复杂系统科学研究进展

二维FM系统的同时故障检测与控制

末次盛冰期以来中国湖泊记录对环流系统及气候类型的响应

汽车侧倾运动安全主动悬架LQG控制器设计方法

周炎涛的其他基金

分布式不确定skyline查询处理关键技术研究

相似国自然基金