混合属性条件下的聚类分析方法研究

基本信息
批准号:61502093
项目类别:青年科学基金项目
资助金额:20.00
负责人:冀进朝
学科分类:
依托单位:东北师范大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:赵晓威,王晗,罗娜,张健,艾美乐,张文艺,王宏艳,周雨鹏
关键词:
簇中心初始化聚类算法混合属性数据聚类分析
结项摘要

With the wide application of information technology in the social life, data are generated continuously from human society in all aspects, such as the field of medical health, education, social networks, shopping malls and shopping website. These data are often with both numerical and categorical attributes. Most of the existing clustering methods are designed for a single type attribute data. Considering the coexistence of numerical attributes and categorical attributes in many real-life applications, the development of efficient clustering analysis method for mixed data has become an important research issue in cluster analysis. Inspired from the existing problems in this field, this project designs the cluster center initialization method for mixed data; develop the determination mechanism of the appropriate number of clusters for mixed data by combining the rival penalized competitive learning mechanism, the automatic determination technology of parameters; design the intelligent global optimization strategy for mixed data by integrating the dissimilarity measure for mixed data, the automatic determination technology of parameters and the swarm intelligent optimization strategy. This study not only contributes the further development of clustering analysis theory, which has the important theory significance; but also provides a set of scientific, effective methods to solve the actual decision problems represented by clustering analysis, which has the important application value.

随着信息技术在社会生活中的广泛应用,人类社会在各个方面比如医疗卫生、教育、社交网站、商场和购物网站等领域源源不断的产生数据。这些数据大多同时具有数值和分类属性,而现有的聚类分析方法大多是针对单一属性类型数据设计的。同时考虑数值属性和分类属性的特点,开发混合属性条件下的高效聚类分析方法已成为聚类分析领域的一个重要研究方向。本项目针对该研究领域存在的问题,拟提出混合属性条件下的簇中心初始化方法;结合竞争者惩罚竞争学习机制、参数自动确定技术等思想开发混合属性条件下的恰当簇数的自动确定机制;基于融合混合属性特征的相异性度量、参数自动确定技术和群智能寻优策略设计混合属性条件下的智能全局优化策略。该研究不仅对聚类分析理论的进一步发展做出贡献,具有重要的理论意义;也为解决以聚类分析为代表的实际决策问题提供一组科学、有效的分析手段,具有重要的应用价值。

项目摘要

人类社会在教育、医疗、银行、社交网络、线上线下购物平台等各个方面都积累了大量的数据。这些数据大多同时具有不同类型的属性,主要分为数值属性和分类属性。聚类分析是从数据中获取知识的重要手段。本课题在分析现有聚类方法存在局限性的基础上,同时考虑这两类属性的取值特点和分布特征,系统研究面向混合属性数据条件下的聚类分析方法。本课题的研究内容包括三个方面:簇中心初始位置的确定、恰当簇数的确定和全局优化策略。在簇中心初始位置的确定方面,在考虑不同属性取值特点和分布特征的基础上,采用数据点的密度、邻居集来度量数据点在簇中的中心性,用距离来衡量二者之间的远近,提出了一种混合属性条件下的簇中心初始位置的确定方法;在恰当簇数的确定方面,结合竞争者竞争惩罚学习学习机制和参数自动确定技术设计出了混合属性条件下恰当簇数的自动确定方法。在全局优化方面,采用人工蜂群算法的寻优策略结合局部搜索策略OKP,设计了混合属性条件下的全局优化策略。本课题在青年基金的资助下顺利进行并完成了任务,在国内外高水平期刊和会议上共发表5篇研究论文,其中SCI检索论文4篇。本课题的深入研究不仅对聚类分析理论的发展做出贡献,具有一定的理论意义,也为解决以聚类分析为代表的实际决策提供了一组科学、有效的分析手段,具有潜在的应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

冀进朝的其他基金

相似国自然基金

1

基于混合属性分析的人体行为识别方法研究

批准号:61401309
批准年份:2014
负责人:张重
学科分类:F0117
资助金额:24.00
项目类别:青年科学基金项目
2

基于混合模糊信息的多属性群决策方法及其应用研究

批准号:U1304701
批准年份:2013
负责人:张惠民
学科分类:G01
资助金额:20.00
项目类别:联合基金项目
3

基于特征聚类的高维混合属性数据特征选择方法

批准号:61806131
批准年份:2018
负责人:贾红
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目
4

基于电场诱导的核酸混合自组装分子膜属性控制原理和方法研究

批准号:51105222
批准年份:2011
负责人:刘大猛
学科分类:E0505
资助金额:26.00
项目类别:青年科学基金项目