研究高维数据的聚类问题是十分重要的前沿和热点课题,其应用前景极其广泛。本项目主要是通过构建高维数据聚类的具有一定通用性的数学模型,来研究和开发适用于海量高维数据聚类分析的有效方法和工具。我们主要开展以下研究工作:(1)研究从高维数据空间中有效提取候选子空间的方法;(2)研究子空间聚类的数学模型,该模型具有描述不规则形状和跨越不同子空间簇类的能力;(3)在此模型的基础上,研究有效的子空间聚类算法和新的聚类有效性指标;(4) 开展在垃圾邮件识别和垃圾邮件类别细分中的应用研究。本项目将致力于提取候选子空间作为高维数据聚类的预处理步骤,为每个数据对象确定其可能存在的子空间,构建高维数据聚类的实用且具有普适性的数学模型及方法,并与相关学科(数学与信息)及相关行业相呼应,力争创建独具特色的反垃圾邮件新技术和二次挖掘垃圾邮件新方法,大幅度提高垃圾邮件的识别率。
{{i.achievement_title}}
数据更新时间:2023-05-31
EBPR工艺运行效果的主要影响因素及研究现状
基于铁路客流分配的旅客列车开行方案调整方法
向日葵种质资源苗期抗旱性鉴定及抗旱指标筛选
一种基于多层设计空间缩减策略的近似高维优化方法
智能煤矿建设路线与工程实践
高维混合型数据聚类及应用研究
高维稀疏数据聚类研究
基于约束的高维数据聚类
聚类导向的字典学习及基于稀疏表示的高维数据聚类研究