生物序列分析中非比对方法的数学模型研究

基本信息
批准号:11001118
项目类别:青年科学基金项目
资助金额:16.00
负责人:刘迎照
学科分类:
依托单位:洛阳师范学院
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:刘万里,押辉远,王燕,冯三营,吕芳
关键词:
全基因组序列概率向量表示模型非比对方法隐马尔科夫模型图形表示模型
结项摘要

生物序列分析是计算分子生物学研究的核心内容,传统的分析方法主要是以序列比对模型为主,而随着"后基因组(post-genome) "时代的到来,生物序列分析的非比对方法作为对传统方法的补充和发展已逐渐成为计算分子生物学研究中的一个热点领域。利用数理统计、组合优化等数学工具,我们将对非比对方法中的数学模型及其在基因识别、非编码序列研究、种系树构建等方面中的应用进行深入研究:在生物序列图形表示模型的研究中,提出计算上简单可行、适用于较长序列的数值特征;在概率向量表示模型的研究中,寻求更加有效的距离度量去刻画对应生物序列之间的相似程度,进一步提高生物序列分析的准确性;基于HMM模型提出新的蛋白质分类方法。我们将根据蛋白质序列中氨基酸的生物化学性质构建状态空间,使得我们可以直接使用蛋白质的一级序列进行分类;使用简化的Viterbi算法进行打分,从而可以降低算法的复杂度。

项目摘要

生物序列分析的非比对方法是 “后基因组(post-genome)”时代对生物序列大数据研究的一种主要方法。本项目利用数理统计、代数理论等数学工具,对非比对方法中的概率向量模型、几何表示模型及 -联体的特征分布模型在生物序列分析、种系树构建等方面的应用进行了研究。在概率向量模型的研究中,提出了修正欧式距离度量去刻画对应生物序列之间的相似程度,并通过对蛋白质序列分类和HIV-1亚型825条全基因组序列的种系树构建验证了这种距离的有效性;在生物序列图形表示模型的研究中,提出计算上简单可行、适用于较长序列的数值特征;通过对34种哺乳动物线粒体基因组序列以及40种跨膜蛋白序列的种系树构建,研究了基于生物序列 -联体的特征分布构建种系树的有效性问题。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
2

基于MCPF算法的列车组合定位应用研究

基于MCPF算法的列车组合定位应用研究

DOI:
发表时间:2016
3

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021
4

扶贫资源输入对贫困地区分配公平的影响

扶贫资源输入对贫困地区分配公平的影响

DOI:
发表时间:2020
5

四川盆地东部垫江盐盆三叠系海相钾盐成钾有利区圈定:地球物理和地球化学方法综合应用

四川盆地东部垫江盐盆三叠系海相钾盐成钾有利区圈定:地球物理和地球化学方法综合应用

DOI:10.19762/j.cnki.dizhixuebao.2021191
发表时间:2021

刘迎照的其他基金

相似国自然基金

1

序列比对( Alignment)的随机分析与快速算法

批准号:10271061
批准年份:2002
负责人:沈世镒
学科分类:A0210
资助金额:16.50
项目类别:面上项目
2

面向异构并行系统的生物序列比对并行策略及算法研究

批准号:61173013
批准年份:2011
负责人:周炎涛
学科分类:F0204
资助金额:58.00
项目类别:面上项目
3

基于高语义序列比对的网络攻击特征自动提取方法

批准号:61070194
批准年份:2010
负责人:秦拯
学科分类:F0205
资助金额:30.00
项目类别:面上项目
4

大规模生物序列比对及其基于异构系统的并行处理技术研究

批准号:61402400
批准年份:2014
负责人:朱香元
学科分类:F0213
资助金额:25.00
项目类别:青年科学基金项目