基于机器学习的高性能自适应信息抽取关键技术研究

基本信息
批准号:60673041
项目类别:面上项目
资助金额:27.00
负责人:周国栋
学科分类:
依托单位:苏州大学
批准年份:2006
结题年份:2009
起止时间:2007-01-01 - 2009-12-31
项目状态: 已结题
项目参与者:朱巧明,杨季文,李培峰,朱晓旭,李军辉,贡正仙,许兰,吴晓春
关键词:
弱指导机器学习方法互信息依存模型信息抽取系统可移植性
结项摘要

从非结构化的文本中抽取出结构化的特定信息是信息抽取技术研究的重要课题。目前,系统性能和系统可移植性两大关键问题严重制约着信息抽取技术的广泛应用。本项目将在前期研究的基础上,重点解决信息抽取领域的几个关键技术,通过研究机器学习方法,提高信息抽取系统的整体性能,解决系统可移植性问题,开发出适合于中英文的基于机器学习的高性能的自适应信息抽取系统。主要研究内容有:提出一个新颖的互信息依存模型,有效集成不同特征,进一步提高命名实体识别的性能,并具有较好的可扩展性;利用网络挖掘技术和弱指导机器学习方法,减轻命名实体识别和关系抽取对大规模手工标注语料库的依赖,解决信息抽取系统的可移植性问题;通过建立多层学习策略,探索相关类之间的共性,解决关系抽取小类的训练数据不足问题;研究基于机器学习的多代理策略和全局优化方案,深化指代消解的研究;并通过跨文本的指代消解研究,解决多文本中的相关信息的融合问题。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

肥胖型少弱精子症的发病机制及中医调体防治

肥胖型少弱精子症的发病机制及中医调体防治

DOI:10.16368/j.issn.1674-8999.2018.12.569
发表时间:2018
2

EBPR工艺运行效果的主要影响因素及研究现状

EBPR工艺运行效果的主要影响因素及研究现状

DOI:10.16796/j.cnki.1000-3770.2022.03.003
发表时间:2022
3

针对弱边缘信息的左心室图像分割算法

针对弱边缘信息的左心室图像分割算法

DOI:10.3778/j.issn.1002-8331.1911-0012
发表时间:2020
4

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
5

复杂系统科学研究进展

复杂系统科学研究进展

DOI:10.12202/j.0476-0301.2022178
发表时间:2022

周国栋的其他基金

批准号:60873150
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:11301186
批准年份:2013
资助金额:22.00
项目类别:青年科学基金项目
批准号:61673290
批准年份:2016
资助金额:65.00
项目类别:面上项目
批准号:11671139
批准年份:2016
资助金额:48.00
项目类别:面上项目
批准号:61273320
批准年份:2012
资助金额:81.00
项目类别:面上项目
批准号:90920004
批准年份:2009
资助金额:50.00
项目类别:重大研究计划
批准号:61331011
批准年份:2013
资助金额:285.00
项目类别:重点项目

相似国自然基金

1

基于迁移学习的自适应信息抽取技术研究

批准号:61073130
批准年份:2010
负责人:郑德权
学科分类:F0211
资助金额:32.00
项目类别:面上项目
2

医疗对话文本中的信息抽取关键技术研究

批准号:61906196
批准年份:2019
负责人:张元哲
学科分类:F0606
资助金额:25.00
项目类别:青年科学基金项目
3

情感信息抽取的资源建设及关键技术研究

批准号:61375073
批准年份:2013
负责人:李寿山
学科分类:F03
资助金额:78.00
项目类别:面上项目
4

基于篇章特征的越南语新闻事件信息抽取关键技术研究

批准号:61562049
批准年份:2015
负责人:周枫
学科分类:F0211
资助金额:38.00
项目类别:地区科学基金项目