目前商务智能应用中碰到了大量非均衡数据分类问题,其突发性和破坏性可能给企业带来巨大损失。由于商务智能中非均衡数据分类问题除了具有一般非均衡数据分类碰到的问题外,同时还会伴随高维数据、噪声数据、多类别数据、无标号数据等问题,并由此带来了特征间关系复杂,易出现过学习,概念复杂度大,数据利用不充分等问题,现有方法已不能很好地解决这些问题。为此,本项目引入具有较强泛化能力和适应性的集成学习来解决商务智能中非均衡数据分类问题,从分析商务智能中非均衡数据分类问题特征及其影响入手,系统研究商务智能中非均衡数据分类的特征选择和集成学习方法等基础理论问题,并以此为基础从融合多集成学习策略,以及融合集成学习和其它处理技术两个角度,构建基于集成学习的商务智能中非均衡数据分类模型。并通过对企业需求的实地调研,为企业设计商务智能中非均衡数据分类问题的应用方案,增强企业的数据利用能力,为企业赢得可持续的竞争优势。
当前商务智能应用中碰到了大量非均衡数据分类问题,即数据集中某个或几个类别的样本数可能会远少于其它类别样本数的分类问题,例如信用风险分析中的高风险客户相对于正常客户,金融领域的欺诈行为相对于非欺诈行为等,其突发性和破坏性可能给企业带来巨大损失。由于商务智能中非均衡数据分类问题除了具有一般非均衡数据分类碰到的问题外,同时还会伴随高维数据、噪声数据、多类别数据、无标号数据等问题,并由此带来了特征间关系复杂,易出现过学习,概念复杂度大,数据利用不充分等问题,现有方法已不能很好地解决这些问题。为此,本项目引入了具有较强泛化能力和适应性的集成学习来解决商务智能中非均衡数据分类问题,主要研究工作包括:首先,本项目分析了商务智能中非均衡数据分类问题特征及其影响;其次,本项目系统研究了商务智能中非均衡数据分类的特征选择和集成学习方法等基础理论问题;然后,以此为基础构建了基于集成学习的商务智能中非均衡数据分类模型,具体研究从融合多集成学习策略,以及融合集成学习和其它处理技术两个角度展开,其中后一方面有主要包括融合集成学习与取样、代价敏感学习的非均衡数据分类模型,融合集成学习和特征选择的非均衡数据分类模型,融合集成学习和聚类的非均衡数据分类模型,融合集成学习和半监督学习的非均衡数据分类模型等;最后,本项目对基于集成学习的非均衡数据分类方法进行了应用研究,重点选取了目前信息系统领域的两个研究热点:客户行为分析与信用风险管理,以及社交媒体分析与社会化推荐问题进行深入研究,积极探索基于集成学习的非均衡数据分类技术在其中的应用。通过本项目的研究,为解决商务智能中的非均衡数据分类问题提供了新的方式和途径,丰富和完善了非均衡数据分类的理论研究体系,进一步推动商务智能中非均衡数据分类问题的研究和应用,增强企业的数据利用能力,为企业赢得可持续的竞争优势,具有重要的理论意义和实践价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
拥堵路网交通流均衡分配模型
低轨卫星通信信道分配策略
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
物联网中区块链技术的应用与挑战
基于集成学习的不平衡流数据分类问题研究
面向不平衡数据分类的演化硬件集成学习方法研究
基于关联分类规则与集成学习的数据库营销研究
基于半监督学习和集成学习的文本分类方法研究