基于信息重组的多文档自动文摘技术

基本信息
批准号:60803092
项目类别:青年科学基金项目
资助金额:20.00
负责人:徐永东
学科分类:
依托单位:哈尔滨工业大学
批准年份:2008
结题年份:2011
起止时间:2009-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:权光日,刘桃,张德园,朱鲲鹏,程亮,鞠红,朱琳,黄箭
关键词:
层次主题结构多知识源融合多文档自动文摘信息重组
结项摘要

本申请以多文档信息重组为基础内核,建立一个适合多任务的中文多文档自动文摘模型。在剖析多文档主题结构的基础上,深入研究了文本片段相似度计算、多文本主题结构分析、关键信息抽取、文摘句冗余消除、时序排列、文摘评测等一系列关键技术并最终建立起一个高效、准确的汉语多文档自动文摘系统。在最为关键的多文本信息重组算法中,引入了更为接近文本集合真实内容的层次主题结构的概念,以及动态变阈值文本片段聚类的层次主题结构识别算法。在多文档关键信息抽取策略上,通过文本单元信息量化模型以及多知识源的并行融合算法实现了针对不同文摘需求的关键信息抽取。最后本申请还提出了基于模糊标注的多文档文摘评测方法,实现了多文档文摘定量、客观评测。本申请的相关研究成果能够进一步促进相关汉语自然语言处理技术的发展,同时,一个可行的多文档自动文摘模型对于加快人们对网络信息的处理速度与准确率具有重要的实际应用价值。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017

徐永东的其他基金

批准号:61172099
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:50672076
批准年份:2006
资助金额:28.00
项目类别:面上项目
批准号:59772031
批准年份:1997
资助金额:14.00
项目类别:面上项目

相似国自然基金

1

基于逻辑框架的多文档自动文摘技术

批准号:60373100
批准年份:2003
负责人:王晓龙
学科分类:F0211
资助金额:8.00
项目类别:面上项目
2

面向查询的多文档自动文摘技术研究

批准号:60773167
批准年份:2007
负责人:何婷婷
学科分类:F0211
资助金额:26.00
项目类别:面上项目
3

面向查询的多文档自动文摘技术研究

批准号:60673040
批准年份:2006
负责人:何婷婷
学科分类:F0211
资助金额:7.00
项目类别:面上项目
4

面向Web话题的多文档文摘研究

批准号:60903139
批准年份:2009
负责人:张瑾
学科分类:F0211
资助金额:18.00
项目类别:青年科学基金项目