基于自然语言处理技术的蛋白质结构和功能预测

基本信息
批准号:61003090
项目类别:青年科学基金项目
资助金额:21.00
负责人:董启文
学科分类:
依托单位:复旦大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:丁建栋,邵明玉,郁抒思,万琳霞,王世春,黄可平
关键词:
蛋白质序列结构预测自然语言处理技术功能预测
结项摘要

近年来大量的基因组和蛋白质组序列、结构和功能数据不断增加,使得采用数据驱动的方法来解决蛋白质序列-结构-功能映射问题成为可能。生物序列和自然语言之间存在一定的相似性。大量语料库的出现推动了计算语言学的发展,同理,大量的蛋白质序列-结构-功能数据的出现,使得计算的方法和信息技术得以应用于此领域中。本项目将采用计算语言学的工具包括统计语言模型、文本分类技术、机器学习算法以及更高层的语言处理方法来理解细胞中蛋白质的结构和功能。通过将自然语言处理的相关技术引入到生物信息学中,针对蛋白质结构和功能预测的相关问题采用新的计算手段,简化蛋白质结构和功能预测的模型,提高蛋白质结构和功能预测的精度,进而推动蛋白质序列-结构-功能映射问题的发展。项目的研究在生物医学、人类生活、生产实践等方面都有着极为重要的意义。

项目摘要

项目采用自然语言处理的相关技术和方法解决蛋白质结构和功能预测的问题。通过将自然语言处理的相关技术引入到生物信息学中,针对蛋白质结构和功能预测的相关问题采用新的计算手段,简化蛋白质结构和功能预测的模型,提高蛋白质结构和功能预测的精度,进而推动蛋白质序列-结构-功能映射问题的发展。项目揭示了蛋白质序列的语言特征;提出了多种蛋白质同源性检测方法;实现了基于自然语言处理技术的蛋白质结构预测和功能预测方法,取得了良好的结果。项目的研究在生物医学、人类生活、生产实践等方面都有着极为重要的意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

病毒性脑炎患儿脑电图、神经功能、免疫功能及相关因子水平检测与意义

病毒性脑炎患儿脑电图、神经功能、免疫功能及相关因子水平检测与意义

DOI:10.13210/j.cnki.jhmu.20190508.001
发表时间:2019
2

基于被动变阻尼装置高层结构风振控制效果对比分析

基于被动变阻尼装置高层结构风振控制效果对比分析

DOI:10.13197/j.eeev.2019.05.95.fuwq.009
发表时间:2019
3

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
4

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
5

混凝土SHPB试验技术研究进展

混凝土SHPB试验技术研究进展

DOI:10.3969/j.issn.1002-3550.2015.06.010
发表时间:2015

董启文的其他基金

批准号:61672234
批准年份:2016
资助金额:63.00
项目类别:面上项目

相似国自然基金

1

基于自然语言处理技术的DNA结合蛋白质预测

批准号:61573118
批准年份:2015
负责人:王晓龙
学科分类:F03
资助金额:64.00
项目类别:面上项目
2

基于自然语言处理技术的蛋白质相互作用预测方法研究

批准号:60673019
批准年份:2006
负责人:林磊
学科分类:F0214
资助金额:26.00
项目类别:面上项目
3

基于自然语言处理语义分析技术的蛋白质远同源性检测和折叠识别

批准号:61672184
批准年份:2016
负责人:刘滨
学科分类:F0213
资助金额:62.00
项目类别:面上项目
4

基于自然语言处理技术的生物实体语义网络研究和应用

批准号:61202304
批准年份:2012
负责人:魏小梅
学科分类:F0211
资助金额:25.00
项目类别:青年科学基金项目