全基因组结构分析的组合问题与算法

基本信息
批准号:61872427
项目类别:面上项目
资助金额:63.00
负责人:姜海涛
学科分类:
依托单位:山东大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:刘晓文,周爱中,张舒,蒲莲容,顾文艳,王睿智,郝东东
关键词:
近似比算法分析多项式时间
结项摘要

Designing algorithms for combinatorial optimization problems in whole genome structure analysis is an important subject in theoretical computer science. Both genome maximal strip problem and double cut and join rearrangement problem are typical problems in whole genome structure analysis. This project is aiming at: designing new polynomial time approximation algorithms for the maximal strip problem and its complementary problem on genomes without repetition by non-oblivious local search methods, and the approximation factors reach to 3 and 2 respectively; designing a new polynomial time approximation algorithm for the maximal strip problem on genomes with repetitions by linear programming and rounding methods, and the approximation factor reaches to 16/7; designing a new polynomial time 1.375-approximation algorithm and a fixed-parameter time 4/3-approximation algorithm for double cut and join rearrangement problem on unsigned genomes without repetition; designing the first polynomial time approximation algorithm for the problem of breakpoint elimination by double cut and join on genomes with repetitions, with an approximation factor of 1.5. In this project, pursuing better approximation factor is the basic task for designing approximation algorithms. New algorithms of better performance on genome structure analysis problems can have guiding effect on the detection and prediction of genetic diseases.

设计全基因组结构分析中组合问题的算法是理论计算机领域的重要研究内容。基因组最长公共序列问题和二次切割并连接问题都是全基因组结构分析中的典型组合问题。本项目旨在,采用非直接局部搜索技术,设计无重复基因组的最长公共序列原问题和补问题的新多项式时间近似算法,近似性能比分别达到2和3;采用线性规划随机取整技术,设计有重复基因组的最长公共序列问题的新多项式时间近似算法,近似性能比达到16/7;设计无重复无向基因组二次切割并连接问题的近似性能比达到1.375的新多项式时间近似算法,以及近似性能比达到4/3的参数时间近似算法;设计有重复基因组的二次切割并连接断点消除问题的第一个近似算法,近似性能比达到1.5。本项目以竞逐更好的近似性能比作为设计近似算法的根本目标。全基因组结构分析问题的更好性能的新算法,对于遗传疾病的检测和预测具有指导意义。

项目摘要

基因组分析和比较是计算基因组学研究的重要内容之一,对于疾病的检测和预测、探索物种的进化规律有着重要的意义。用计算的方法分析基因组面临的最大挑战是基因组的重复性、不确定性、不完整和存在噪声。为克服这些困难,本项目研究了基因组最长公共序列问题、基因组片段填充问题以及多种模型下的基因组重排问题等典型的组合优化问题。旨在分析证明问题的计算复杂度,设计精确算法或近似算法。主要成果如下:.(1)当基因组都用PQ-树表示时,证明了其断点距离问题和断点中心问题都是NP-难的,并设计了断点距离问题的第一个参数算法。.(2)采用非直接局部搜索技术,设计无重复基因组的最长公共序列补问题的近似性能比为2的多项式时间近似算法。采用线性规划非线性取整技术,设计有重复基因组的最长保守序列问题的近似比为32(k-1)3e3/8e(k-1)-1的近似算法,不证明该问题为APX-hard。.(3)以最大保守对数为优化目标,证明片段填充问题是NP-难的,并设计了近似比为12/7近似算法。以最大公共邻接数为优化目标,设计了近似比为1.4+的近似算法。.(4)对于DCJ模型下的重排问题,设计了有重复序列的近似比为1.44的多项式算法和无重复序列的近似比为4/3的参数时间近似算法。对于移位、有限块移动模型下的重排问题,分别设计了近似比为1.375和3c/5的多项式时间近似算法,其中c表示最大移动距离。.这些问题模型能有效的刻画基因组比较和分析的目标,所设计的算法能有效揭示基因组的潜在性质。.

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
4

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
5

"多对多"模式下GEO卫星在轨加注任务规划

"多对多"模式下GEO卫星在轨加注任务规划

DOI:10.19328/j.cnki.2096-8655.2022.02.002
发表时间:2022

姜海涛的其他基金

批准号:61202014
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:81302336
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

广义组合优化逆问题的算法设计与分析

批准号:11001232
批准年份:2010
负责人:刘龙城
学科分类:A0406
资助金额:17.00
项目类别:青年科学基金项目
2

基因组比较中三个组合问题的算法研究

批准号:61202014
批准年份:2012
负责人:姜海涛
学科分类:F0201
资助金额:24.00
项目类别:青年科学基金项目
3

网络中信息传播优化问题的组合结构、算法设计与复杂性分析及应用

批准号:61063011
批准年份:2010
负责人:李建平
学科分类:F0201
资助金额:25.00
项目类别:地区科学基金项目
4

基因组重复片段问题的算法研究与进化分析

批准号:61902072
批准年份:2019
负责人:蒲莲容
学科分类:F0213
资助金额:26.00
项目类别:青年科学基金项目