针对DNA序列数据每天以海量速度增长和占用存储空间日益增加的问题,本项目研究基于矢量的DNA序列数据压缩算法。.在DNA序列数据压缩过程中发掘序列的生物学解释,采用生物启发式优化算法实现高效的DNA序列仿生聚类,生成编码性能更高的近似重复矢量,替代传统的重复子串匹配方法是本项目追求的目标。.本项目将利用近似重复矢量编码技术寻求DNA序列数据无损压缩中的最佳码书设计。运用生物学知识构建具有生物信息学知识的DNA序列仿生聚类, 寻找序列的生物特性,提取近似重复矢量,构造DNA序列数据的近似重复矢量的数学模型,认识和掌握其内在机理和本质特性。.` 本项目将DNA序列数据压缩研究从"精确重复子串匹配"、"最长精确重复子串匹配"、"近似重复子串匹配"拓展到"近似重复矢量"阶段,在国际上属于源头创新,对于提高DNA序列数据编码效率有着重要的理论价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
DNAgenie: accurate prediction of DNA-type-specific binding residues in protein sequences
EBPR工艺运行效果的主要影响因素及研究现状
外泌体在胃癌转移中作用机制的研究进展
基于铁路客流分配的旅客列车开行方案调整方法
珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征
对虾基因组DNA重复序列的分析和定位研究
基于近似重复结构的建筑建模、修复和绘制
网络环境下矢量数据压缩与渐进传输方法研究
与人遗传病相关的DNA重复序列柔性的实验和理论研究