Various text processing techniques are proposed to handle different kinds of text applications, such as text summarization, text recommendation, etc. The techniques seldom consider the cognitive mechanisms of human reading process and neglect that any text information requirement is generated from the limitation of human reading ability. Therefore the techniques can hardly handle multiple applications. The maturity of a science area usually accompanies with the appearance of a fundamental and general theory or model on the area. Analyzing text through analyzing cognitive mechanisms of human reading process not only is a new and effective method, but also meets the subjective cognition of people. We handled a series of text applications by simulating human reading process which demonstrated the feasibility of building a general text information processing model.. This project incorporates cognitive linguistics, cognitive semantics and psychology, extracts and quantifies the cognitive mechanisms of human reading process, analyzes and simulates human reading process from computer perspective, and then builds general text information processing model. The model can generate suitable methods for different kinds of text applications. Its extendible structure can evolve with the study on cognitive process of reading. The model improves the development of text processing techniques from cognitive perspective.
针对不同的文本应用,例如:文本摘要、文本推荐等,出现了各式各样的文本处理技术。这些技术很少考虑阅读过程中的认知机制,忽视了人对文本信息的任何需求都源于阅读认知能力的限制。所以这些技术很难同时适用于多种文本应用。通适性的基础理论或模型往往是一个研究领域成熟的标志。通过模拟阅读认知过程中的认知机制来分析文本不仅是一种新的、有效的方式,还可以使分析结果符合人的主观认知。我们通过模拟阅读认知过程已成功解决一系列文本应用,初步论证了通过模拟认知机制来构建通适性文本信息处理模型的可行性。. 在此基础上,本项目结合认知语言学,认知语义学和心理学,提取并量化阅读认知过程中的认知机制,从计算机角度分析并模拟阅读认知过程,建立通适性文本信息处理模型。该模型能够针对不同文本应用衍生出不同的处理方法,其可扩展的结构更可随着对阅读认知过程研究的深入而不断完善。该模型从认知本源视角推进了文本处理技术的发展。
本项目结合认知心理学和认知语言学,初步构建了阅读过程的认知模拟模型,主要工作包含理论和应用两个方面。.理论方面,本项目主要针对如下理论进行了研究。.1.该模拟模型以人在阅读过程中的印象度为核心变量,初步模拟了人在普通阅读过程、目标阅读过程和扩展阅读过程中各概念的印象度变化。.2.针对模拟模型运行时所需的背景知识,本项目研究了背景知识库的自动构建机制以支持模拟模型的运作。.3.本项目研究了三个常见的关键语义关系“is-part-of”,“subcategory”和“instance”的作用以及对文本认知的影响。.4.本项目扩展了传统的资源空间模型以支持模拟模型的存储。.应用方面,本项目应用模拟模型解决了如下文本应用。..1. 单文本问答。本项目设计系统扫描单个文本,然后回答与该文本内容相关的问题。.2.面向不同抽象层次的问答系统。本项目将概念抽象层次引入到问答系统中,使得问答系统能够过在多个候选答案中选择概念抽象层次符合用户的回答。.3.文本推荐。本项目将概念抽象层次引入到文本推荐中,使得文本推荐能够按照用户给定的更概括或者更具体的方向进行推荐,以适应不同知识水平的用户。.4. 迷惑答案生成。本项目通过分析概念之间的迷惑度和相似关系,实现了选择题的迷惑选项生成算法。该算法能够在给定问题和正确答案的情况下,生产若干错误答案。.5. 问答系统。为分析“is-part-of”,“subcategory”和“instance”三个最基本的概念间语义关系的作用,及其对背景知识库的影响,本项目使用这三种语义关系构建了基于概念分类知识的问答系统,以分析这三种语义关系的影响。..6. 特定内容抽取。该应用能够在给定一个特殊目标(关键词集合)的前提下,在文本内抽取与该特定目标相关的信息。.7. 目标导向文本相似度。该应用能够在给定一个特殊目标(关键词集合)的前提下,比较多个文本之间在该目标之上的文本相似度。.8. 综述自动生成。本项目结合论文间引用,实现了论文“related works”部分的自动生成。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
农超对接模式中利益分配问题研究
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
基于成熟认知模型的文本归类新技术研究
基于认知语境的文本情感计算及其应用
基于认知机理和语义层次的文本分类方法研究
基于图论模型的文本重叠聚类研究