基于自适应密度的聚类算法及其在大气污染中的应用研究

基本信息
批准号:61762057
项目类别:地区科学基金项目
资助金额:38.00
负责人:陈梅
学科分类:
依托单位:兰州交通大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:高红亮,兰丽,林俊山,温晓芳,吴挡平,杨朴舟,贾茹阁
关键词:
自适应密度大气污染聚类算法
结项摘要

Nowadays, datasets with clusters which are arbitrary shapes, sizes and densities, including air pollution receptor datasets, are widely arisen. When grouping this type of dataset, many state-of-the-art clustering algorithms face two problems: the clustering results are inaccurate and the appropriate input parameters are not easily determinable. Among the clustering algorithms, the density-based methods have significant advantages, because they can find arbitrary-shaped clusters. However, so far, only a few works have considered varying densities. This project plans to employ the mutual nearest neighbors technology and Gaussian mixture model to construct the density of a data point, along with determining the corresponding parameters according to the local distribution of data points. To effectively detect various clusters, the clustering analysis will be based on three different ways which are core points, cluster backbone and cluster boundary. At last, the project plans to employ the adaptive-density-based clustering methods to group the air pollution receptor data, then perform sources apportionment accurately. The methods which will be presented in this research can improve the accuracy and robustness of clustering results for complex datasets with clusters which are various densities and shapes,by easily determining the corresponding input parameters. Moreover, this project will offer several theoretical supports and technical references for the wise use of air pollution receptor data and the access of accurate pollution sources and other pollution characteristics.

目前,包括大气污染受体数据在内的以任意密度、任意形状及任意规模簇分布的数据集广泛出现。很多先进的聚类算法在处理此类型数据时,均面临着精确性不高及输入参数不易确定的问题。其中,基于密度的聚类算法由于能识别任意形状簇而具有显著的优越性,但其固定的密度设置策略导致此类算法不一定适合同一数据集中的所有簇。目前只有少量工作对基于可变密度的聚类算法进行了研究。本项目拟利用互近邻技术和高斯混合模型构建数据点的自适应密度,并根据数据点的局部分布确定相应参数的取值,从簇核心点、簇主干以及簇边界点三个角度进行聚类,有效检测出各种簇。最后,本项目拟对大气污染受体数据进行基于自适应密度的聚类分析,进而准确解析出污染源。本项目的研究成果能够在易确定聚类算法输入参数的条件下,提高对数据集中任意簇的检测结果的准确性和鲁棒性,还能对合理利用大气污染受体数据、准确解析出污染源及其污染特征提供理论支持和技术参考。

项目摘要

任意密度、任意形状及任意规模簇分布的检测是聚类研究中的一个重要方向,在很多现实问题中都具有重要应用价值。本项目对基于自适应密度的聚类算法进行了深入研究,并将其应用于大气污染受体数据分析。研究内容包括: (1)数据点自适应密度研究。提出了一种基于数据点影响力的局部密度、一种基于近邻数量与距离的局部密度和一种基于点对距离的数据点局部密度。并且,为了更好地构建自适应密度,进行了数据点间距离度量方法研究。利用数据点间的近邻关系,提出了一种基于互近邻的数据点间距离度量方法、一种基于公共邻域和数据点斥力的距离计算方法和基于互k-近邻的双向绝对距离度量方法;基于数据点间的相互作用关系,提出了一种基于密度引力的距离度量方法和一种基于数据点吸引力的距离度量方法。 (2)基于自适应密度的聚类算法研究。从发现簇核心点进而发现簇主干的角度,提出了一种基于数据点间密度引力的聚类算法、一种基于顶点间邻居关系的图聚类算法DCCB、一种基于核心顶点的无参图聚类算法NGCC、一种基于核心调整初始簇结构的图聚类算法ACC和一种基于检测最大度顶点的图聚类算法SUM;从发现簇边界点的角度,提出了一种基于局部中心度量的边界点划分密度聚类算DBLCM;另外还提出了基于自适应邻居图正则的表示学习聚类算法RLANGR和基于多点相似的聚类算法Mulsim。 (3)大气污染受体数据分析研究。根据特定领域内数据的特征,提出了一种基于大气污染数据特性的距离度量方法;开发了一套空气信息管理评估系统;分析了兰州和乌海的臭氧污染情况并解析了污染源。本项目超额完成了计划目标和任务。发表论文13篇,其中SCI检索5篇,EI检索1篇,中文核心期刊4篇;发表论文中9篇为第一作者或通讯作者;发表软著1项,专著2部;参加国内重要学术会议9次;作为硕士研究生导师招收研究生9名,参与指导课题组硕士研究生3名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

EBPR工艺运行效果的主要影响因素及研究现状

EBPR工艺运行效果的主要影响因素及研究现状

DOI:10.16796/j.cnki.1000-3770.2022.03.003
发表时间:2022
2

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
3

基于MCPF算法的列车组合定位应用研究

基于MCPF算法的列车组合定位应用研究

DOI:
发表时间:2016
4

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
5

"多对多"模式下GEO卫星在轨加注任务规划

"多对多"模式下GEO卫星在轨加注任务规划

DOI:10.19328/j.cnki.2096-8655.2022.02.002
发表时间:2022

陈梅的其他基金

批准号:70902062
批准年份:2009
资助金额:18.00
项目类别:青年科学基金项目
批准号:61562010
批准年份:2015
资助金额:38.00
项目类别:地区科学基金项目
批准号:61603421
批准年份:2016
资助金额:21.00
项目类别:青年科学基金项目
批准号:31400212
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:31500042
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目

相似国自然基金

1

基于最大公共子图的谱聚类算法在文本聚类中的应用研究

批准号:61363028
批准年份:2013
负责人:陈笑蓉
学科分类:F0211
资助金额:43.00
项目类别:地区科学基金项目
2

基于量子鱼群优化策略的聚类算法及其在图像分割中的应用研究

批准号:61100141
批准年份:2011
负责人:常冬霞
学科分类:F06
资助金额:22.00
项目类别:青年科学基金项目
3

缺失多视图聚类算法及其应用研究

批准号:61906020
批准年份:2019
负责人:李苗苗
学科分类:F0603
资助金额:24.00
项目类别:青年科学基金项目
4

多元信息融合的多策略群智能算法及其在软件模块聚类中的应用研究

批准号:61603163
批准年份:2016
负责人:周新宇
学科分类:F0305
资助金额:20.00
项目类别:青年科学基金项目