基于信息重组的多文档自动文摘技术

基本信息
批准号:60803092
项目类别:青年科学基金项目
资助金额:20.00
负责人:徐永东
学科分类:
依托单位:哈尔滨工业大学
批准年份:2008
结题年份:2011
起止时间:2009-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:权光日,刘桃,张德园,朱鲲鹏,程亮,鞠红,朱琳,黄箭
关键词:
层次主题结构多知识源融合多文档自动文摘信息重组
结项摘要

本申请以多文档信息重组为基础内核,建立一个适合多任务的中文多文档自动文摘模型。在剖析多文档主题结构的基础上,深入研究了文本片段相似度计算、多文本主题结构分析、关键信息抽取、文摘句冗余消除、时序排列、文摘评测等一系列关键技术并最终建立起一个高效、准确的汉语多文档自动文摘系统。在最为关键的多文本信息重组算法中,引入了更为接近文本集合真实内容的层次主题结构的概念,以及动态变阈值文本片段聚类的层次主题结构识别算法。在多文档关键信息抽取策略上,通过文本单元信息量化模型以及多知识源的并行融合算法实现了针对不同文摘需求的关键信息抽取。最后本申请还提出了基于模糊标注的多文档文摘评测方法,实现了多文档文摘定量、客观评测。本申请的相关研究成果能够进一步促进相关汉语自然语言处理技术的发展,同时,一个可行的多文档自动文摘模型对于加快人们对网络信息的处理速度与准确率具有重要的实际应用价值。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于国产化替代环境下高校计算机教学的研究

基于国产化替代环境下高校计算机教学的研究

DOI:
发表时间:
2

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
3

基于被动变阻尼装置高层结构风振控制效果对比分析

基于被动变阻尼装置高层结构风振控制效果对比分析

DOI:10.13197/j.eeev.2019.05.95.fuwq.009
发表时间:2019
4

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
5

基于多色集合理论的医院异常工作流处理建模

基于多色集合理论的医院异常工作流处理建模

DOI:
发表时间:2020

徐永东的其他基金

批准号:61172099
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:50672076
批准年份:2006
资助金额:28.00
项目类别:面上项目
批准号:59772031
批准年份:1997
资助金额:14.00
项目类别:面上项目

相似国自然基金

1

基于逻辑框架的多文档自动文摘技术

批准号:60373100
批准年份:2003
负责人:王晓龙
学科分类:F0211
资助金额:8.00
项目类别:面上项目
2

面向查询的多文档自动文摘技术研究

批准号:60773167
批准年份:2007
负责人:何婷婷
学科分类:F0211
资助金额:26.00
项目类别:面上项目
3

面向查询的多文档自动文摘技术研究

批准号:60673040
批准年份:2006
负责人:何婷婷
学科分类:F0211
资助金额:7.00
项目类别:面上项目
4

面向Web话题的多文档文摘研究

批准号:60903139
批准年份:2009
负责人:张瑾
学科分类:F0211
资助金额:18.00
项目类别:青年科学基金项目