In this project, we will propose the classification and multiple-sequence regression algorithms based on multiple-instance data. First, put forward a multiple-instance one-class classification algorithm based on maximum-margin-based support vector data description. In multiple-instance outlier detection, we can usually obtain a collection of positive bags. Given a training set which contains only the positive bags, we adopt the maximum margin principle and build a maximum-margin-based multiple-instance one-class classifier to improve the classification accuracy. Second, present a multiple-instance classification algorithm by incorporating the Universum data. The Universum data is related to the classification task, but has different data distributions. Incorporating the Universum data in the training process can refine the boundary to be more accurate. Third, propose a multiple-instance classification algorithm with ordered labels. In real-world multiple-instance applications, the classification labels are sometimes imputed with an order and represent some ranking information. Considering this ranking information of labels into the learning process can improve the classification performance. Last, present a multiple-instance multiple-sequence regression algorithm. By building a uniform model for learning the multiple sequences, the connection of sequences can be incorporated into learning the regression functions. Our project aims at designing the multiple-instance algorithms by resolving the above learning problems.
在本项目中,我们拟提出面向多示例数据的分类和多序列回归算法。首先,提出基于最大间隔超球体支持向量机的多示例一分类算法。在异常多示例包侦测应用中,往往可以获得大量的正类多示例包。在给定一组正类多示例包的情况下,采用最大间隔思想,建立多示例一分类器,提高多示例分类精度。其次,提出基于非样本多示例包融合的多示例分类算法。非样本(Universum)多示例包是一组与分类任务相关,但具有不同分布的数据,通过利用非样本多示例包的辅助信息,提高分类边界划分的准确性。再次,提出基于有序分类标签学习的多示例分类算法。在实际应用中,分类标签之间可能具有一定的等级顺序关系,通过引入分类标签的等级信息,增强多示例分类器的性能。最后,提出基于多序列任务学习的多示例回归算法。通过多示例序列的联合学习,把序列之间的关联性整合到回归训练中,改善多示例回归学习的效果。本项目旨在通过以上问题的解决为多示例算法的研究提供思路。
多示例学习是机器学习和模式识别的重要研究领域。多示例学习是以多示例包为训练单元的学习问题。在多示例学习中,训练集由一组具有分类标签的多示例包组成,每个多示例包含有若干个没有分类标签的示例。本项目设计了一批面向多示例数据的分类和回归算法。针对在异常多示例包侦测应用中,可能缺乏负类多示例包的问题,提出了基于最大间隔超球体支持向量机的多示例一分类算法。针对非样本多示例数据学习问题,建立了基于非样本多示例包融合的多示例分类算法。针对在多示例多分类应用中,不同分类标签之间可能具有一定等级顺序的问题,构建了基于有序分类标签学习的多示例分类算法。针对在涉及多个序列任务的回归学习中,不同序列之间可能具有关联性的问题,提出了基于多序列任务学习的多示例回归算法。通过本项目的研究,共发表SCI刊物论文15篇。其中,包括1篇《IEEE Transactions on Neural Networks and Learning Systems》(一区SCI期刊, IF: 8.793),2篇《IEEE Transactions on Cybernetics》(一区SCI期刊,IF: 11.079),3篇《Information Sciences》(二区SCI期刊,IF: 5.91),2篇《Neurocomputing》(二区SCI期刊,IF: 4.438),7篇《Knowledge-Based Systems》(二区SCI期刊,IF: 5.921)等。另外,申请授权发明专利9项,培养硕士研究生9人。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
面向高维多示例数据的潜在语义分类模型及其实现
面向大规模数据的多示例学习
面向多视角多标签数据的支持张量机分类算法研究
面向大数据分层分类学习的多粒度计算模型和算法