全基因组结构分析的组合问题与算法

基本信息
批准号:61872427
项目类别:面上项目
资助金额:63.00
负责人:姜海涛
学科分类:
依托单位:山东大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:刘晓文,周爱中,张舒,蒲莲容,顾文艳,王睿智,郝东东
关键词:
近似比算法分析多项式时间
结项摘要

Designing algorithms for combinatorial optimization problems in whole genome structure analysis is an important subject in theoretical computer science. Both genome maximal strip problem and double cut and join rearrangement problem are typical problems in whole genome structure analysis. This project is aiming at: designing new polynomial time approximation algorithms for the maximal strip problem and its complementary problem on genomes without repetition by non-oblivious local search methods, and the approximation factors reach to 3 and 2 respectively; designing a new polynomial time approximation algorithm for the maximal strip problem on genomes with repetitions by linear programming and rounding methods, and the approximation factor reaches to 16/7; designing a new polynomial time 1.375-approximation algorithm and a fixed-parameter time 4/3-approximation algorithm for double cut and join rearrangement problem on unsigned genomes without repetition; designing the first polynomial time approximation algorithm for the problem of breakpoint elimination by double cut and join on genomes with repetitions, with an approximation factor of 1.5. In this project, pursuing better approximation factor is the basic task for designing approximation algorithms. New algorithms of better performance on genome structure analysis problems can have guiding effect on the detection and prediction of genetic diseases.

设计全基因组结构分析中组合问题的算法是理论计算机领域的重要研究内容。基因组最长公共序列问题和二次切割并连接问题都是全基因组结构分析中的典型组合问题。本项目旨在,采用非直接局部搜索技术,设计无重复基因组的最长公共序列原问题和补问题的新多项式时间近似算法,近似性能比分别达到2和3;采用线性规划随机取整技术,设计有重复基因组的最长公共序列问题的新多项式时间近似算法,近似性能比达到16/7;设计无重复无向基因组二次切割并连接问题的近似性能比达到1.375的新多项式时间近似算法,以及近似性能比达到4/3的参数时间近似算法;设计有重复基因组的二次切割并连接断点消除问题的第一个近似算法,近似性能比达到1.5。本项目以竞逐更好的近似性能比作为设计近似算法的根本目标。全基因组结构分析问题的更好性能的新算法,对于遗传疾病的检测和预测具有指导意义。

项目摘要

基因组分析和比较是计算基因组学研究的重要内容之一,对于疾病的检测和预测、探索物种的进化规律有着重要的意义。用计算的方法分析基因组面临的最大挑战是基因组的重复性、不确定性、不完整和存在噪声。为克服这些困难,本项目研究了基因组最长公共序列问题、基因组片段填充问题以及多种模型下的基因组重排问题等典型的组合优化问题。旨在分析证明问题的计算复杂度,设计精确算法或近似算法。主要成果如下:.(1)当基因组都用PQ-树表示时,证明了其断点距离问题和断点中心问题都是NP-难的,并设计了断点距离问题的第一个参数算法。.(2)采用非直接局部搜索技术,设计无重复基因组的最长公共序列补问题的近似性能比为2的多项式时间近似算法。采用线性规划非线性取整技术,设计有重复基因组的最长保守序列问题的近似比为32(k-1)3e3/8e(k-1)-1的近似算法,不证明该问题为APX-hard。.(3)以最大保守对数为优化目标,证明片段填充问题是NP-难的,并设计了近似比为12/7近似算法。以最大公共邻接数为优化目标,设计了近似比为1.4+的近似算法。.(4)对于DCJ模型下的重排问题,设计了有重复序列的近似比为1.44的多项式算法和无重复序列的近似比为4/3的参数时间近似算法。对于移位、有限块移动模型下的重排问题,分别设计了近似比为1.375和3c/5的多项式时间近似算法,其中c表示最大移动距离。.这些问题模型能有效的刻画基因组比较和分析的目标,所设计的算法能有效揭示基因组的潜在性质。.

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

姜海涛的其他基金

批准号:61202014
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:81302336
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

广义组合优化逆问题的算法设计与分析

批准号:11001232
批准年份:2010
负责人:刘龙城
学科分类:A0406
资助金额:17.00
项目类别:青年科学基金项目
2

基因组比较中三个组合问题的算法研究

批准号:61202014
批准年份:2012
负责人:姜海涛
学科分类:F0201
资助金额:24.00
项目类别:青年科学基金项目
3

网络中信息传播优化问题的组合结构、算法设计与复杂性分析及应用

批准号:61063011
批准年份:2010
负责人:李建平
学科分类:F0201
资助金额:25.00
项目类别:地区科学基金项目
4

基因组重复片段问题的算法研究与进化分析

批准号:61902072
批准年份:2019
负责人:蒲莲容
学科分类:F0213
资助金额:26.00
项目类别:青年科学基金项目