不平衡数据学习中学习目标与评价准则的研究

基本信息

批准号：61573348

项目类别：面上项目

资助金额：65.00

负责人：胡包钢

学科分类：

依托单位：中国科学院自动化研究所

批准年份：2015

结题年份：2019

起止时间：2016-01-01 - 2019-12-31

项目状态：已结题

项目参与者：李纯果,范兴容,张勇,曹林林,樊艳波,盛柯恺

关键词：

学习目标选择Boosting分类器不平衡数据学习评价准则选择机器学习

结项摘要

Imbalanced data learning is one of the challenges in big data processing. This program aims at a systematic study on the primary problem, namely “What to learn?”, in the imbalanced data learning. In a theoretical level, we will explore what the specific learning targets will be required by the imbalanced data learning in both “linguistic” and “computational” levels, respectively. A study will be made on the intrinsic properties of the learning targets and evaluation criteria, so that we can reach a theoretical understanding why some measures are proper in dealing with imbalanced data learning, some are not. We will further explore the information-based learning targets and criteria in comparison with the non-information ones, and will derive the their relations with respect to the imbalance ratio. The goal of the analytical study is to provide the guidelines in the selections of learning targets and evaluation criteria. In the approach level, we will advance the current classifiers with the abstaining functions for wider applications. We will study on the optimization of reject threshold and its associated properties. We will further explore the information-based learning targets and criteria in comparison with the non-information ones. Their connections are investigated. A novel boosting classifier will be developed by setting the multiple learning targets for a classifier-example study towards a large-scale data process. These targets will include the adaptation of imbalance ratio in the data, abstaining and non-abstaining classification, and convexity optimization. The final goal of this program is to put forward on the new study theme of “learning target selection” in machine learning and to provide a study example in the abstaining classifier design in imbalanced data learning.

不平衡数据学习是大数据中的挑战之一。本课题旨在针对不平衡数据学习中首要问题“学习目标选择”进行系统性研究。在理论层面，探讨不平衡数据学习对“语义”与“计算”表达层面的特定学习目标；分析各种学习目标或评价准则的本质属性，解释为什么有些学习目标或准则能够完成不平衡数据学习任务，有些则无法胜任；推导各种常规性能类和信息类学习目标或评价准则与不平衡数据比的定量或定性关系。理论研究将为应用中选择学习目标或评价准则提供理论依据。在方法层面，扩展现有分类器包括拒识功能的应用，研究优化拒识学习目标及其拒识中优化门槛值性质；开展面向大规模数据的Boosting分类器研究，使其能够实现带拒识功能的学习，自适应于不平衡比的优化门槛值调节，并尽量兼容“凸优化”的学习目标。本课题的最终目标是推动以“学习目标选择”为主题的新视角研究方向，并为不平衡数据学习中包容拒识功能的分类器设计提供具体研究实例。

项目摘要

不平衡数据学习是大数据中的挑战之一。本课题针对不平衡数据学习中首要问题“学习目标选择”进行了系统性研究。在理论层面，探讨了不平衡数据学习对“语义”与“计算”表达层面的特定学习目标；分析了各种学习目标或评价准则的本质属性，对于学习目标或评价准则是否能胜任不平衡数据中的学习任务，以人脸图像为例进行了解释；推导了两种常规性能类和信息类学习目标或评价准则与不平衡数据比的定量或定性关系。理论研究为应用中选择学习目标或评价准则提供了理论依据。在方法层面，我们扩展了现有分类器包括拒识功能的应用，研究优化了拒识学习目标及其拒识中优化门槛值性质。本课题的研究成果推动了以“学习目标选择”为主题的新视角研究方向，并为不平衡数据学习中包容拒识功能的分类器设计提供了具体研究实例。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13334/j.0258-8013.pcsee.190276

发表时间：2020

DOI：10.13336/j.1003-6520.hve.20200528028

发表时间：2021

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

胡包钢的其他基金

批准号：69874041

批准年份：1998

资助金额：12.00

项目类别：面上项目

批准号：60275025

批准年份：2002

资助金额：24.00

项目类别：面上项目

批准号：61273196

批准年份：2012

资助金额：82.00

项目类别：面上项目

批准号：60073007

批准年份：2000

资助金额：17.00

项目类别：面上项目

批准号：61075051

批准年份：2010

资助金额：35.00

项目类别：面上项目

相似国自然基金

高维不平衡数据的集成学习算法研究

批准号：11526161

批准年份：2015

负责人：殷清燕

学科分类：A0602

资助金额：3.00

项目类别：数学天元基金项目

基于半监督集成学习的不平衡数据研究

批准号：61203292

批准年份：2012

负责人：陈欢欢

学科分类：F0603

资助金额：24.00

项目类别：青年科学基金项目

面向不平衡数据的学习算法及应用研究

批准号：61070061

批准年份：2010

负责人：蒋盛益

学科分类：F0605

资助金额：32.00

项目类别：面上项目

基于集成学习的不平衡流数据分类问题研究

批准号：61906167

批准年份：2019

负责人：任思琪

学科分类：F0603

资助金额：24.00

项目类别：青年科学基金项目

不平衡数据学习中学习目标与评价准则的研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

带有滑动摩擦摆支座的500 kV变压器地震响应

基于腔内级联变频的0.63μm波段多波长激光器

新型树启发式搜索算法的机器人路径规划

智能煤矿建设路线与工程实践

胡包钢的其他基金

模糊PID控制器的系统化研究

智能系统中基于非线性变化能力的研究

面向"知识"与"数据"共同驱动的机器学习模型参数可辨识性研究

单株植物生长的计算机建模与三维可视化仿真

基于信息理论的机器学习目标与评价度量的研究

相似国自然基金