基于衍生距离数学模型的半监督聚类集成研究

基本信息
批准号:61572199
项目类别:面上项目
资助金额:65.00
负责人:余志文
学科分类:
依托单位:华南理工大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:文贵华,吴斯,王大兴,孙亚新,李丹杨,陈弘晟,朱铣均,王志强,赵卓雄
关键词:
聚类集成核函数聚类算法相似性度量
结项摘要

Abstract: Motivated by models of visual cortex, Prof. Steve smale, who won the Fields medal, proposed the mathematics model of the derived distance. When compared with traditional distance functions, derived distance functions not only possess the hierarchical structure, but also capture invariant representation of objects. Derived distance can be defined as a hierarchy of associations, which can serve as the similarity measure between two objects. But the construction process of traditional derived distance has several limitations: (1) the templates are randomly selected, which lead to lack of stableness and robustness for the mathematics model of the derived distance; (2) there are a lot of selected templates, which lead to the redundancy and the inefficiency; (3) the derived distance is combined with single clustering algorithm for clustering analysis, which does not make use of the diversity property of the derived distance. In order to address these limitations, we propose a new construction process based on the sparse representation for the mathematics model of the derived distance, design a new probabilistic based evaluation function to select the representative templates, and reduce the redundancy with sparse representation in the process of feature encoding in the new project. We also design a new semi-supervised clustering ensemble approach based on the mathematics model of the derived distance. The models and clustering solutions in the ensemble are optimized by the multi-objective algorithm. The new approach will be applied to different areas. In summary, the project provides a new way for the mathematics foundation of similarity theory and its application in the area of artificial intelligence.

受到视觉皮层模型层次组织结构的启发,菲尔兹奖获得者Steve Smale首次提出了衍生距离函数的数学模型。与传统的距离函数不同,衍生距离函数不但具有多层的结构,而且能够把握物体内在恒定的特征表达。但传统衍生距离的计算存在一定的局限性,如:构建过程中,模板的随机选择使得衍生距离数学模型稳定性和强壮性缺乏;选取的模板过多,导致特征编码时产生大量冗余,造成计算效率的低下;与单一聚类算法相结合进行聚类分析,没有充分利用衍生距离的多样性。针对这些局限性,我们将提出一种基于稀疏表示的衍生距离数学模型构建方法,设计基于概率的评估函数选择代表性的模板,运用稀疏表示来减少特征编码的冗余,从而增强衍生距离的稳定性和强壮性,并设计新的基于衍生距离数学模型的半监督聚类集成算法,充分利用衍生距离的多样性,运用多目标算法对集成器进行优化。该项目将为相似性度量数学理论的深入研究及其在人工智能领域的应用提供一条新的思路

项目摘要

受到视觉皮层模型层次组织结构的启发,菲尔兹奖获得者Steve Smale首次提出了衍生距离函数的数学模型。与传统的距离函数不同,衍生距离函数不但具有多层的结构,而且能够把握物体内在恒定的特征表达。但传统衍生距离的计算存在一定的局限性,如:构建过程中,模板的随机选择使得衍生距离数学模型稳定性和强壮性缺乏;选取的模板过多,导致特征编码时产生大量冗余,造成计算效率的低下;与单一聚类算法相结合进行聚类分析,没有充分利用衍生距离的多样性。针对这些局限性,本项目提出衍生距离数学模型的构建方法,并在此基础上实现半监督聚类集成方法,最终提出基于衍生距离数学模型的半监督聚类集成框架。.查阅相关资料,探讨衍生距离数学模型基本要素的获取方式,设计基于概率的评估函数选择代表性的模板,探讨层间和层内间映射操作的选择方式,目的在于更准确地获取不同层次间的编码方式。 .提出一种基于稀疏表示的衍生距离数学模型构建方法,使不同层次间的编码得到融合,并运用稀疏表示来减少特征编码的冗余。此外,设计多种衍生距离函数,使不同的衍生距离函数与核函数进行充分结合,利用多目标优化机制进行核函数的选择,从而增强衍生距离的稳定性和强壮性。.设计基于衍生距离数学模型的半监督聚类集成方法,充分利用衍生距离的多样性,运用多目标算法对集成器进行优化。构建多种测试环境,以验证所提衍生距离数学模型是否具有鲁棒性。同时,测试基于衍生距离数学模型的半监督聚类集成方法的区分性能,收集实验数据并进行模型改进,最后完成报告撰写。.完成和完善相应的衍生距离数学模型的构建工作,进一步改进基于衍生距离数学模型的半监督聚类集成方法,对衍生距离数学模型的构建方法和半监督聚类集成器进行性能评估,并将衍生距离数学模型的构建方法和基于衍生距离数学模型的半监督聚类集成方法应用到相似性度量数学理论的研究和人工智能各个领域中。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
2

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

余志文的其他基金

相似国自然基金

1

半监督聚类集成的关键技术研究

批准号:61003142
批准年份:2010
负责人:王红军
学科分类:F0607
资助金额:18.00
项目类别:青年科学基金项目
2

基于半监督学习的聚类集成机理及高效算法研究

批准号:61170111
批准年份:2011
负责人:杨燕
学科分类:F0607
资助金额:55.00
项目类别:面上项目
3

多视图半监督聚类集成方法及应用研究

批准号:61572407
批准年份:2015
负责人:杨燕
学科分类:F06
资助金额:63.00
项目类别:面上项目
4

面向高维数据集成降维的半监督聚类方法研究

批准号:61105048
批准年份:2011
负责人:曾洪
学科分类:F0603
资助金额:24.00
项目类别:青年科学基金项目