文本语义模型和子空间聚类研究

基本信息
批准号:60905028
项目类别:青年科学基金项目
资助金额:19.00
负责人:景丽萍
学科分类:
依托单位:北京交通大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:周雪忠,徐薇,陈萍,张小平,汪廷华,赵静,马丽艳,周丽平,税仪冬
关键词:
子空间聚类知识库本体文本聚类文本语义模型
结项摘要

信息化飞速发展的今天,文本数据海量涌现。如何从这些海量的文本数据中快速、自动地挖掘出对人们有用的知识是当今人们面临的重要任务之一,文本挖掘技术也就成了当今的热点研究方向。本项目将针对文本挖掘核心技术- - 文本表示模型构建和聚类方法设计进行创新性的研究,主要体现在以下几个方面:针对文本数据特性(海量、高维、稀疏、复杂语义),创建同时涵盖语法和语义信息的文本表示模型;设计适合高维稀疏海量数据的快速有效聚类方法;为聚类结果设计出基于知识库的主题概念抽取方法和结果评估方法;进而开发整合文本预处理、文本模型构建、聚类功能和结果评估展现的文本聚类系统原型,该系统可以作为独立的系统运行,同时也可以作为现有数据挖掘系统的子系统模块。

项目摘要

信息化飞速发展的今天,文本数据海量涌现。如何从这些海量的文本数据中快速、自动地挖掘出对人们有用的知识是当今人们面临的重要任务之一,文本挖掘技术也就成了当今的热点研究方向。本项目针对文本挖掘核心技术- - 文本表示模型构建和聚类方法设计进行创新性的研究,主要体现在以下几个方面:针对文本数据特性(海量、高维、稀疏、复杂语义),创建同时涵盖语法和语义信息的文本表示模型;设计适合高维稀疏海量数据的快速有效聚类方法;为聚类结果设计出基于知识库的主题概念抽取方法和结果评估方法;进而开发整合文本预处理、文本模型构建、聚类功能和结果评估展现的文本聚类系统原型。同时,基于本项目,项目组成员进行了多媒体数据语义分析以及高维数据特征提取等相关研究,并取得了较好的成果,为后续的研究工作提供基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

EBPR工艺运行效果的主要影响因素及研究现状

EBPR工艺运行效果的主要影响因素及研究现状

DOI:10.16796/j.cnki.1000-3770.2022.03.003
发表时间:2022
2

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
3

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
4

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

DOI:
发表时间:2019
5

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021

景丽萍的其他基金

批准号:61773050
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:61375062
批准年份:2013
资助金额:80.00
项目类别:面上项目

相似国自然基金

1

基于语义的中文文本聚类研究

批准号:60772081
批准年份:2007
负责人:施水才
学科分类:F0113
资助金额:30.00
项目类别:面上项目
2

基于图论模型的文本重叠聚类研究

批准号:61202312
批准年份:2012
负责人:吴秦
学科分类:F0605
资助金额:23.00
项目类别:青年科学基金项目
3

知识增强的子空间聚类

批准号:61876022
批准年份:2018
负责人:李春光
学科分类:F0605
资助金额:62.00
项目类别:面上项目
4

基于最大公共子图的谱聚类算法在文本聚类中的应用研究

批准号:61363028
批准年份:2013
负责人:陈笑蓉
学科分类:F0211
资助金额:43.00
项目类别:地区科学基金项目