大数据环境下基于同步原理的数据流挖掘算法研究

基本信息
批准号:61403062
项目类别:青年科学基金项目
资助金额:25.00
负责人:邵俊明
学科分类:
依托单位:电子科技大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:陈安龙,罗瑜,刘金虎,王军,甘骏,王磊
关键词:
分类算法数据流挖掘概念漂移聚类分析大数据
结项摘要

Due to the rapid development of information technique, data streams have been produced at an explosive speed in diverse fields such as real-time surveillance systems, meteorological satellite remote sensing, mobile communication network, social network and e-commerce. However, due to the intrinsic properties of data streams: large volume, temporally ordered, evolving nature and the potential infinite length, the existing data stream mining algorithms are usually associated with high time and space complexity. Meanwhile, it is a non-trivial task to capture and learn the evolving data structure and concept drift, and to handle the data complexity. The previous works of the applicant demonstrate that synchronization is a powerful mechanism to extract hidden patterns from data. The synchronization–based data analysis also shows several desirable properties such as dynamic, data locality and multi-scale analysis, which allow handling the data stream mining problem well. Therefore, the objective of this project is to propose new data stream clustering and classification algorithms based on the principle of synchronization, which are expected to provide a promising way to extract knowledge from big data.

信息技术的快速发展使得高速数据流正以前所未有的速度在各个领域不断地产生,如实时监控系统、气象卫星遥感、移动通信网、社交网络及电子商务等。由于数据流具有海量性、时序性、演化性及潜在无限性等特点,目前大规模数据流分析面临时空复杂度高、数据演化跟踪与学习困难及数据源复杂等问题。申请人前期的研究表明同步原理是数据分析和挖掘的一个有力机制,且基于同步原理的分析方法具有的动态性、局部性及多尺度分析特性很好地契合了目前大规模数据流挖掘面临的问题和挑战。因此,本研究拟在大数据时代背景下,以同步原理为新视角,从数据流的聚类分析和分类预测两个方面展开深入的理论研究,探讨其面临的关键技术,提出新的数据流聚类和分类挖掘算法并在大规模数据流集上进行验证,提高人们从海量数据流中挖据和提炼知识的能力。

项目摘要

项目按照原定计划进行,完成了的基于同步原理的大规模数据流聚类分析和分类算法研究。针对数据流具有的海量性、时序性、演化性及潜在无限性等特点,项目以同步原理为新视角,从数据流的聚类分析和分类预测两个方面展开深入的理论研究,探讨了其面临的关键技术,提出了新的数据流聚类和分类挖掘算法并在大规模数据流集上进行验证,提高人们从海量数据流中挖掘和提炼知识的能力。因此,执行情况概述分为三部分,第一部分是基于同步原理的大规模数据流聚类分析:主要包括基于同步的大规模数据聚类算法研究、子空间聚类算法研究和数据流上的聚类算法研究。第二部分为基于同步的大规模数据流分类算法研究:主要包括基于同步的数据流分类研究、数据流上的半监督学习和分布式数据流算法研究。此外,在研究基础上,进一步扩展了相关研究。因此,第三部分为数据流挖掘在各个领域的应用研究:主要包括基于数据流的径流时空演化研究和脑科学上的应用研究。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
3

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020
4

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

邵俊明的其他基金

相似国自然基金

1

大数据环境下高维数据流挖掘算法及应用研究

批准号:61370200
批准年份:2013
负责人:冯林
学科分类:F0205
资助金额:75.00
项目类别:面上项目
2

面向数据流的异常挖掘算法研究

批准号:60673191
批准年份:2006
负责人:蒋盛益
学科分类:F06
资助金额:24.00
项目类别:面上项目
3

基于数据流挖掘的径流对环境变化的动态响应研究

批准号:41601025
批准年份:2016
负责人:杨勤丽
学科分类:D0702
资助金额:20.00
项目类别:青年科学基金项目
4

基于数据分布评估和支持向量机方法的分布式数据流挖掘模型和算法研究

批准号:61273293
批准年份:2012
负责人:毛国君
学科分类:F0603
资助金额:81.00
项目类别:面上项目