文本语义模型和子空间聚类研究

基本信息
批准号:60905028
项目类别:青年科学基金项目
资助金额:19.00
负责人:景丽萍
学科分类:
依托单位:北京交通大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:周雪忠,徐薇,陈萍,张小平,汪廷华,赵静,马丽艳,周丽平,税仪冬
关键词:
子空间聚类知识库本体文本聚类文本语义模型
结项摘要

信息化飞速发展的今天,文本数据海量涌现。如何从这些海量的文本数据中快速、自动地挖掘出对人们有用的知识是当今人们面临的重要任务之一,文本挖掘技术也就成了当今的热点研究方向。本项目将针对文本挖掘核心技术- - 文本表示模型构建和聚类方法设计进行创新性的研究,主要体现在以下几个方面:针对文本数据特性(海量、高维、稀疏、复杂语义),创建同时涵盖语法和语义信息的文本表示模型;设计适合高维稀疏海量数据的快速有效聚类方法;为聚类结果设计出基于知识库的主题概念抽取方法和结果评估方法;进而开发整合文本预处理、文本模型构建、聚类功能和结果评估展现的文本聚类系统原型,该系统可以作为独立的系统运行,同时也可以作为现有数据挖掘系统的子系统模块。

项目摘要

信息化飞速发展的今天,文本数据海量涌现。如何从这些海量的文本数据中快速、自动地挖掘出对人们有用的知识是当今人们面临的重要任务之一,文本挖掘技术也就成了当今的热点研究方向。本项目针对文本挖掘核心技术- - 文本表示模型构建和聚类方法设计进行创新性的研究,主要体现在以下几个方面:针对文本数据特性(海量、高维、稀疏、复杂语义),创建同时涵盖语法和语义信息的文本表示模型;设计适合高维稀疏海量数据的快速有效聚类方法;为聚类结果设计出基于知识库的主题概念抽取方法和结果评估方法;进而开发整合文本预处理、文本模型构建、聚类功能和结果评估展现的文本聚类系统原型。同时,基于本项目,项目组成员进行了多媒体数据语义分析以及高维数据特征提取等相关研究,并取得了较好的成果,为后续的研究工作提供基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

景丽萍的其他基金

批准号:61773050
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:61375062
批准年份:2013
资助金额:80.00
项目类别:面上项目

相似国自然基金

1

基于语义的中文文本聚类研究

批准号:60772081
批准年份:2007
负责人:施水才
学科分类:F0113
资助金额:30.00
项目类别:面上项目
2

基于图论模型的文本重叠聚类研究

批准号:61202312
批准年份:2012
负责人:吴秦
学科分类:F0605
资助金额:23.00
项目类别:青年科学基金项目
3

知识增强的子空间聚类

批准号:61876022
批准年份:2018
负责人:李春光
学科分类:F0605
资助金额:62.00
项目类别:面上项目
4

基于最大公共子图的谱聚类算法在文本聚类中的应用研究

批准号:61363028
批准年份:2013
负责人:陈笑蓉
学科分类:F0211
资助金额:43.00
项目类别:地区科学基金项目