Different type of traffics in Internet show imbalanced distributions naturally. It is very important for network management and security to identify imbalanced Internet traffics effectively at their early stage. Traditional identifying techniques suffer from high false negative rates when applying for imbalanced traffics. Thus, it is a critical problem to be resolved for Internet traffic identification research to study early stage imbalanced traffic identification systematically. In this project, we will study the early stage imbalanced traffic identification problem theoretically and technically: (1) For theoretical aspect, we are set to seek an effective imbalanced model for the data gravitation classification model; (2) For the technical aspect, we will firstly study the accurate ground information labeling technique of Internet traffic data. Based on the accurate traffic data, we will study the early stage feature extraction method for imbalanced traffics and the validations of the feature sets. And then, by using the feature data, we will study imbalanced identification techniques for single-type and multi-type of Internet traffics. At last, based on the aforementioned techniques, we will develop an applicable prototype of imbalanced traffic identification system. Our works could provide a systemic solution for the imbalanced Internet traffic identification problem.
互联网中各类流量天然地呈不平衡分布状态,在非平衡流量发生的早期阶段,对其进行准确高效的识别对网络管理与网络安全都有极其重要的意义。传统识别方法识别非平衡流量时,具有漏报率高等重大缺陷。因而,针对互联网非平衡分布流量,研究有效的识别方法准确高效地识别非平衡流量,是流量识别与应用中的一个亟待解决的问题。本项目就这一问题,从基础理论与应用技术两条主线上系统地开展研究:(1)理论上,基于数据引力分类方法,研究高效的非平衡数据引力分类方法,寻求非平衡流量的有效识别算法;(2)技术上,首先针对具有准确背景信息的流量数据采集困难问题,研究流量样本的背景信息标记技术;基于有效的基础数据,研究非平衡流量早期特征的提取方法与有效性验证;进而通过有效特征数据,研究单目标类型与多目标类型非平衡流量识别技术;最后基于这些关键技术,研发具有实际应用价值的非平衡流量识别系统,为互联网非平衡流量识别提供系统的解决方案。
互联网中的应用流量,天然呈不平衡分布状态。特别是一些特定的异常应用流量,例如不健康视频、入侵攻击、恶意应用等流量,在互联网流量中的占比很小。但这些异常应用流量却往往是流量识别的重点。因此,针对这些类型的流量,在其早期发生阶段快速对其进行准确识别,具有非常重要的网络管理与安全方面的意义。本项目以这一实际问题为研究工作的出发点,以项目组前期在数据引力学习理论方面的成果为基础,研究了互联网非平衡流量的早期识别。项目首先研究了非平衡特定应用流量数据的采集技术,并在可控网络环境下进行大量的数据采集、预处理工作,制作了具有准确背景信息的互联网视频流量数据集、移动互联网恶意应用流量数据集;在有效的流量数据集基础上,项目研究了非平衡流量的早期特征提取问题,包括传统网络层面的特征提取,以及针对特定应用的内容层面特征提取,并对这些不同类型的特征进行了深入的有效性评估研究;针对互联网流量类别不平衡特性,项目结合数据引力学习模型,从数据重采样层面上、模型层面上提出了非平衡数据引力学习方法,并进一步将非平衡数据引力学习模型应用于流量识别,取得了理想的识别效果。项目关于非平衡学习方面的基础研究成果对互联网大数据智能处理有着重要的科学意义;另一方面,项目关于非平衡流量识别方面的成果则在互联网管理与安全方面有着良好的应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
基于SSVEP 直接脑控机器人方向和速度研究
低轨卫星通信信道分配策略
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
网络流量分类识别的理论与方法研究
面向移动互联网流量的行为特征和自适应分类方法研究
基于n阶引力场理论的数据分类研究
互联网未知流量聚类与识别技术研究