基于自适应演化计算的大规模特征选择研究

基本信息

批准号：61876089

项目类别：面上项目

资助金额：62.00

负责人：薛羽

学科分类：

依托单位：南京信息工程大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：钟水明,田青,孙乐,沈超,周宏豪,赵彬平,唐焘,贾伟溦,于思洋

关键词：

混合群体智能优化粒子群优化算法与应用群体智能优化算法烟花算法群体进化算法

结项摘要

Feature selection is an important data pre-processing technique for solving the "curse of dimensionality" of classification methods. Feature selection can simplify classification model, improve classification accuracy, reduce training time, etc. through selecting the most related features from input datasets. However, big data is a serious challenge to feature selection methods. This research mainly focuses on the problems and methods of large-scale feature selection, self-learning classification system based on evolutionary feature selection, and the application of evolutionary feature selection in intrusion detection system. The main work of the research can be described as follows: 1) Propose a self-adaptive particle swarm optimization algorithm for large-scale single objective feature selection problems. 2) Propose a self-adaptive evolutionary algorithm for large-scale multi-objective feature selection problems. 3) Propose a self-learning classification system based on optimal features and artificial neural network' topology and parameters, and propose another self-learning classification system based on optimal features and evolutionary classification method. This research work can provide efficient methods for large-scale feature selection problems, and can expand the research scope of feature selection. Furthermore, its research results can be applied to many scientific and engineering fields.

特征选择是解决分类器“维度灾难”问题的一种重要数据预处理技术。通过对分类器输入数据集合进行特征选择，可以简化分类模型、提高分类精度、减少训练时间等。然而，大数据的出现对现有特征选择方法构成了严重挑战。本课题拟从大规模特征选择问题及方法、基于演化特征选择的自学习分类系统、演化特征选择在入侵检测系统中的应用三个层面进行研究。具体而言:1)研究求解大规模单目标特征选择问题的自适应粒子群算法；2)研究求解大规模多目标特征选择问题的自适应演化算法；3)研究特征集合、神经网络拓扑结构及参数同时优化的自学习分类系统;研究特征集合和演化分类器参数同时优化的自学习分类系统；4)研究多目标演化特征选择及自学习分类系统在数据类别不平衡和分类代价敏感的入侵检测系统中的应用。该研究课题可为大规模特征选择问题提供有效方法，可拓展特征选择的研究范围，其研究成果可应用于众多科学研究和实际工程领域。

项目摘要

最近十几年中，机器学习方法得到了较好的研究和应用。机器学习方法的输入通常具有多维特征，而机器学习方法的训练时间随着特征维度的增加迅速增长，不断增加的特征维度将造成“维度灾难”现象。而实际上，机器学习方法所依赖的输入数据集合中通常存在着大量不相关的和冗余的特征。这些不相关的和冗余的特征不仅会增加训练时间，而且会降低机器学习方法的性能。特征选择的目的是在原始特征集合中选取使机器学习方法性能达到最佳的最小特征子集。特征选择通过去除不相关的和冗余的特征可以减少数据维度、简化机器学习方法模型、增强学习系统的可理解性、提高预测精度、减少训练时间。. 课题主要围绕特征选择问题及方法，从“基于自适应粒子群算法的大规模单目标特征选择”、“大规模多目标自适应演化特征选择”、“基于演化特征选择的自学习分类系统”三个方面展开了研究。具体而言，主要针对“面向单目标特征选择的演化算法”、“面向多目标特征选择的演化算法”、“基于特征选择的演化分类”、“基于演化特征选择的演化人工神经网络”、“演化深层神经网络”，“代理模型辅助的演化深层神经网络”等内容进行了研究。通过研究发现，作为数据预处理技术，特征选择无论是对浅层学习还是深层学习都十分重要。演化计算技术在机器学习方法设计优化中（包括输入优化，模型优化，模型架构优化、参数优化，损失函数优化）占据十分重要的地位。代理辅助的演化学习在未来研究中将扮演十分重要的角色。. 在基金支持下，项目顺利开展，最终取得了略高于规划的研究成果。共发表SCI论文25篇；发表会议论文2篇；申请发明专利5项；申请软件著作权6项。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2018

DOI：10.16383/j.aas.2016.c150880

发表时间：2016

DOI：10.19596/j.cnki.1001-246x.8419

发表时间：2022

DOI：10.3969/j.issn.0255-8297.2020.01.002

发表时间：2020

DOI：

发表时间：2019

薛羽的其他基金

批准号：61403206

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

相似国自然基金

基于序优化的大规模特征选择方法

批准号：60274054

批准年份：2002

负责人：高峰

学科分类：F0304

资助金额：20.00

项目类别：面上项目

大规模矩阵特征值的快速与并行计算

批准号：19771073

批准年份：1997

负责人：张振跃

学科分类：A0502

资助金额：5.00

项目类别：面上项目

基于概率计算的大规模MIMO检测方法

批准号：61501084

批准年份：2015

负责人：陈杰男

学科分类：F0105

资助金额：18.00

项目类别：青年科学基金项目

基于异质扩散模拟的机械信号动态演化特征自适应增强方法及其应用

批准号：50475022

批准年份：2004

负责人：朱利民

学科分类：E0503

资助金额：25.00

项目类别：面上项目

基于自适应演化计算的大规模特征选择研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

硬件木马:关键问题研究进展及新动向

基于SSVEP 直接脑控机器人方向和速度研究

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

物联网中区块链技术的应用与挑战

一种改进的多目标正余弦优化算法

薛羽的其他基金

面向大规模复杂优化问题的自适应合作协同进化算法研究

相似国自然基金