基于成熟认知模型的文本归类新技术研究

基本信息
批准号:61003126
项目类别:青年科学基金项目
资助金额:19.00
负责人:过弋
学科分类:
依托单位:华东理工大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:李振武,叶琪,翟洁,胡芳槐,田相坤,潘友勇,李阳
关键词:
文本归类归类算法文本表示综合特征模型认知模型
结项摘要

随着文本归类技术在搜索引擎技术、数字图书馆技术、信息过滤、信息检索、互联网信息监控、个性化信息推送等领域的广泛应用,文本归类技术研究己经成为信息处理的前沿课题之一。现有研究工作忽略了人在文本归类过程中的角色和因素,文本归类技术仅停留在词(词组)匹配、统计和计算的基础上,缺乏对文本内容的认知和理解,该局限性大大影响了文本归类的性能。.本课题将探索与大脑阅读理解相关的成熟认知模型在文本归类上的研究价值和技术实现方式。通过理论分析两个成熟认知模型间的互补关系,研究文本归类技术所必需的信息元素及性质,构建能准确反映文本内容的综合特征模型,将模型特征选择和归纳技术融入归类算法。本课题的研究成果将有利于揭示文本归类技术的认知性本质,创新文本表示的数学模型,促进文本归类技术的认知智能化,提高文本归类结果的精确率和覆盖率,以及为相关文本处理技术在模型构建和创新方面提供理论依据和实证支持。

项目摘要

随着文本归类技术在搜索引擎技术、数字图书馆技术、信息过滤、信息检索、互联网信息监控、个性化信息推送等领域的广泛应用,文本归类技术研究己经成为信息处理的前沿课题之一。已有的典型研究工作忽略了人在文本归类过程中的角色和因素,文本归类技术仅停留在词(词组)匹配、统计和计算的基础上,缺乏对文本内容的认知和理解,该局限性大大影响了文本归类的性能。. 本课题探索了与大脑阅读理解相关的成熟认知模型在文本归类上的研究价值和技术实现方式。通过理论分析两个成熟认知模型间的互补关系,研究文本归类技术所必需的信息元素及性质,构建能准确反映文本内容的综合特征模型,将模型特征选择和归纳技术融入归类算法。. 在具体技术层面上,本项目基于两个成熟认知模型(“构造-综合”模型和“事件-索引”模型)设计了一个文本综合特征模型,提供了一种将认知机理引入文本归类领域的新思路,将事件、主角、时间性、因果关系、空间性和意图性等六个信息维度,在文字、陈述命题和情形等三个层面上构建相应的认知过程,将内容推理归纳融入到文本归类技术研究中,推动了文本归类技术在认知层面上的深化,准确表示文本内容。. 多维度多层面的综合特征模型,规避了目前对文本广泛采用的高维表示方法,将文本表示的维数进行了有效限制(最多不超过九维,即六个维度和三个层面),提高了文本表示模型的复用性,必将显著节约计算资源,提高计算速度。. 采用多维度多层面的综合特征模型对文本内容进行表示和管理,使得从文本内容中提取关键信息有更强的针对性;而且,该模型的维度和层面为提取得到的文本信息提供了统一、准确的语义注释,将极大的便利后续的内容推理归纳、向量特征比较和类别向量矩阵归一化计算。. 本课题的研究成果有力的揭示文本归类技术的认知性本质,创新文本表示的数学模型,促进文本归类技术的认知智能化,提高文本归类结果的精确率和覆盖率,以及为相关文本处理技术在模型构建和创新方面提供理论依据和实证支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析

伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析

DOI:10.3760/cma.j.issn.0376-2491.2018.33.004
发表时间:2018
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

过弋的其他基金

相似国自然基金

1

基于认知机制模拟的文本信息处理模型研究

批准号:61602256
批准年份:2016
负责人:胥备
学科分类:F06
资助金额:20.00
项目类别:青年科学基金项目
2

基于认知语境的文本情感计算及其应用

批准号:60973068
批准年份:2009
负责人:林鸿飞
学科分类:F0211
资助金额:30.00
项目类别:面上项目
3

基于认知机理和语义层次的文本分类方法研究

批准号:60673109
批准年份:2006
负责人:江铭虎
学科分类:F06
资助金额:25.00
项目类别:面上项目
4

基于图论模型的文本重叠聚类研究

批准号:61202312
批准年份:2012
负责人:吴秦
学科分类:F0605
资助金额:23.00
项目类别:青年科学基金项目