融合指代消解和迁移学习的蛋白质交互关系抽取的研究

基本信息
批准号:61173101
项目类别:面上项目
资助金额:55.00
负责人:李丽双
学科分类:
依托单位:大连理工大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:张宏颖,黄德根,周惠巍,赵晶,回敬,蒋振超,范文婷,李丹
关键词:
语义核蛋白质交互关系信息抽取迁移学习指代消解
结项摘要

蛋白质交互关系的研究是后基因组时代的主要任务,为疾病的诊断、预防、治疗和新药的发现提供依据和启发。目前其文本挖掘的方法主要是从生物医学文献的摘要中抽取关系,但摘要中包含的信息有限,同时指代消解和语料库的领域适应问题都没有得到很好解决,致使抽取的性能较低。本项目针对生物医学文献全文并采用指代消解技术和迁移学习方法进行蛋白质交互关系抽取。内容主要包括:1.蛋白质名识别及标准化;2.建立基于全文和针对蛋白质交互关系的指代消解模型;3.选择句子级和篇章级特征,组合含有领域知识的语义核建立基于全文的关系抽取模型;4.引入迁移学习思想并与主动学习相结合,解决蛋白质交互关系抽取中的领域适应问题。最终获得高性能的蛋白质交互关系抽取模型。并与领域专家合作,构建肝癌的蛋白质交互关系数据库及可视化,为肝癌的研究提供分子生物学知识,同时验证蛋白质交互关系抽取模型的真实有效性。

项目摘要

蛋白质交互关系的研究是后基因组时代的主要任务,为疾病的诊断、预防、治疗和新药的发现提供依据和启发。本项目着重研究了针对生物医学文献全文,采用指代消解技术和迁移学习方法进行蛋白质交互关系抽取。内容主要包括:基于组合分类器的蛋白质名称识别、整合多种有效方法的多阶段蛋白质名称标准化、组合机器学习和规则方法的指代消解、基于全文的蛋白质交互关系抽取、融合外部语义资源的组合核函数蛋白质交互关系抽取、基于迁移学习与主动学习相结合的蛋白质交互关系抽取以及蛋白质交互关系网络分析平台的构建。最终获得高性能的蛋白质交互关系抽取模型,以及包括蛋白质名称识别、标准化、指代消解和关系抽取的可视化系统。并与领域专家合作,构建了癌症相关的蛋白质交互关系数据库。为癌症的研究提供分子生物学知识,同时验证了蛋白质交互关系抽取模型的真实有效性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

DOI:10.13334/j.0258-8013.pcsee.190276
发表时间:2020
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

DOI:
发表时间:2021
4

TRPV1/SIRT1介导吴茱萸次碱抗Ang Ⅱ诱导的血管平滑肌细胞衰老

TRPV1/SIRT1介导吴茱萸次碱抗Ang Ⅱ诱导的血管平滑肌细胞衰老

DOI:10.3969/j.issn.1001-1978.2022.02.019
发表时间:2022
5

信息熵-保真度联合度量函数的单幅图像去雾方法

信息熵-保真度联合度量函数的单幅图像去雾方法

DOI:10.3724/SP.J.1089.2019.17435
发表时间:2019

李丽双的其他基金

相似国自然基金

1

基于统计关系学习的汉语指代消解研究

批准号:60673043
批准年份:2006
负责人:陈家骏
学科分类:F0211
资助金额:24.00
项目类别:面上项目
2

基于句法结构和语义信息的指代消解研究

批准号:61003153
批准年份:2010
负责人:孔芳
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目
3

汉语指代消解与多文本交叉共指研究

批准号:60173005
批准年份:2001
负责人:王厚峰
学科分类:F0211
资助金额:18.00
项目类别:面上项目
4

突变导致的蛋白质-蛋白质关系抽取研究

批准号:61906028
批准年份:2019
负责人:赵哲焕
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目