许多应用具有典型的分布式数据流特征,如网络环境下的多节点访问数据、信用卡交易流等。和单数据流的模式挖掘相比,分布式数据流需要分布式的挖掘构架,由此带来的理论和方法上的问题需要解决。目前的分布式数据流挖掘的研究刚刚起步,一些关键的科学问题已经提出,但是对应的理论和方法有限。本项目选取分布式数据流的集成模式挖掘模型、带概念漂移的分布式数据流的知识发现算法两个主要问题,择选基于数据分布评估的数据概要挖掘、模式融合以及面向速率不均匀的分布式数据流的概念漂移挖掘算法等关键问题进行理论研究和技术探索。研究的创新和特色表现在:利用数学和人工智能等手段,研究分布式数据流的代数构造及其有效挖掘算子,为分布式数据流的集成模式挖掘模型的建立提供设计和评价基础;利用统计学和已有的数据挖掘技术等,探索基于数据分布评估的数据概要挖掘模型,建立面向于速率不均匀的分布式数据流的有效概念漂移挖掘算法等。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
基于全模式全聚焦方法的裂纹超声成像定量检测
基于混合优化方法的大口径主镜设计
极区电离层对流速度的浅层神经网络建模与分析
基于集成学习的分布式XML数据流的挖掘模型与概念漂移挖掘方法研究
非均衡概念漂移网络舆情大数据流挖掘模型、算法与评价机制研究
融入概念漂移情境的商业数据流挖掘及可靠性研究
基于数据分布评估和支持向量机方法的分布式数据流挖掘模型和算法研究