在线模型选择的增量素描方法

基本信息

批准号：62006234

项目类别：青年科学基金项目

资助金额：16.00

负责人：张骁

学科分类：

依托单位：中国人民大学

批准年份：2020

结题年份：2022

起止时间：2021-01-01 - 2022-12-31

项目状态：已结题

项目参与者：

关键词：

模型选择在线推荐在线学习增量素描方法后悔分析

结项摘要

Online learning is one of the fundamental methods of machine learning for streaming data mining and sequential prediction. Online model selection aims to study the evaluation and selection of hypothesis spaces in online learning, which is the key to the theoretical research and practical application of online learning. Most of the existing online model selection methods use offline model selection methods to select models on all examples in advance. These methods do not guarantee that the online learning process is in a single pass, have high computational complexities, and lack sound theoretical guarantees. To address these issues, we propose an incremental sketching method for online model selection, which is in a single-pass over the sequence of examples and has the consistency and high efficiency. We constructs the incremental sketches of the example sequence and the hypothesis space, maintaining the necessary information for online model selection efficiently and incrementally. Moreover, we derive the regret bounds of online model selection, design the unbiased online model selection criteria. Finally, combining incremental matrix decomposition and online convex optimization methods, we implement online model selection algorithms with a constant space complexity and a linear or sublinear time complexity with respect to the number of rounds, and further apply the proposed algorithms to online recommendation. This project develops the sketching theory for online model selection, designs the general and efficient online model selection algorithms, and provides an effective way for online machine learning applications for complex data and complex models.

在线学习是流式数据挖掘与序列决策的基本机器学习方法之一。在线模型选择旨在研究在线学习中假设空间的评价与选择，是在线学习理论研究与实际应用的关键。已有的在线模型选择方法大多预先应用离线模型选择方法在全体样本上进行模型选择，不能保证在线学习过程是单趟的，且具有较高的计算复杂度，缺乏可靠的理论保证。针对这些问题，提出在线模型选择的增量素描方法，保证在线模型选择是单趟、一致且高效的。通过构造样本序列和假设空间的增量素描结构，高效且增量地维护在线模型选择所需的必要信息；在此基础上，推导在线模型选择的后悔界，设计无偏的在线模型选择准则；最后，结合增量矩阵分解和在线凸优化，实现具有常数空间复杂度和关于回合数线性或亚线性时间复杂度的在线模型选择算法，将所提出算法应用于在线推荐场景。本项目将发展在线模型选择的素描理论，设计通用且高效的在线模型选择算法，为面向复杂数据和复杂模型的在线机器学习应用提供有效途径。

项目摘要

为了解决在线模型选择的理论保证和计算效率问题，本项目从如下三方面开展研究工作，并且取得了一系列原创性的创新性的前沿研究成果，具体包括：.1) 增量素描假设空间中的在线模型选择遗憾分析与算法设计：项目组聚焦于连续的候选核空间，依据每回合模型选择和模型训练的不同顺序，将连续核空间中的在线核选择分为两类，并分别给出得到最优遗憾界所需的条件，将在线核选择的整体时间复杂度降为关于回合数拟线性级，解决了在线核选择的高计算复杂度问题。实验结果验证了理论结果的正确性和所提出算法的高效性。所提出的遗憾分析框架为在线模型选择问题提出了新的理论保证和解决方案。.2) 不同约束下的高效在线选择模型理论与算法：用户的延迟反馈问题会使得在线模型选择算法收集到的历史数据中存在标签缺失或标签错误的情形，导致所选择的模型存在偏差，对在线模型选择效果造成负面影响，项目组提出了一种可自动修正环境反馈的反事实批量化赌博机算法（CBDF），对于延迟反馈，CBDF在序列决策中的每一幕中，应用反事实采样方法修正环境反馈，生成修正后的奖励值，并应用批量化赌博机策略实现在线模型选择；在在线模型选择应用场景中，在线算法的公平性变得越来越重要，项目组提出了一种名为 P-MMF 的在线学习模型来解决这个问题，P-MMF 制定公平推荐作为资源分配问题，以达到在线学习的最大最小公平性。.3) 面向偏差数据的在线推荐应用：现阶段在线推荐模型往往基于用户交互数据进行训练，用户交互数据是从用户和系统的交互过程中产生的，是以用户为中心的。但是也正是因为数据是从交互中产生的，用户的点击行为往往会受到其他因素的干扰。为了解决这一问题，项目组针对不同偏差利用因果推断技术帮助在线推荐算法进行纠偏。.围绕上述研究内容，本项目共计发表文章6篇 (全部为CCF A类论文)，获国内专利授权1个、申请国内专利3个。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：

发表时间：2020

张骁的其他基金

批准号：31670289

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：30871300

批准年份：2008

资助金额：31.00

项目类别：面上项目

批准号：31170271

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：70802026

批准年份：2008

资助金额：16.00

项目类别：青年科学基金项目

批准号：81902869

批准年份：2019

资助金额：21.50

项目类别：青年科学基金项目

批准号：71172060

批准年份：2011

资助金额：42.00

项目类别：面上项目

批准号：31870272

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：30570964

批准年份：2005

资助金额：30.00

项目类别：面上项目

批准号：30270689

批准年份：2002

资助金额：20.00

项目类别：面上项目

相似国自然基金

增量学习模型研究

批准号：60375022

批准年份：2003

负责人：吕宝粮

学科分类：F0603

资助金额：22.00

项目类别：面上项目

支持增量式稀疏编码的在线协同目标跟踪研究

批准号：61302156

批准年份：2013

负责人：韩光

学科分类：F0117

资助金额：24.00

项目类别：青年科学基金项目

南海夏季风的年际增量预测方法和预测模型研究

批准号：41175071

批准年份：2011

负责人：范可

学科分类：D0502

资助金额：70.00

项目类别：面上项目

增量协同过滤模型研究

批准号：61202347

批准年份：2012

负责人：罗辛

学科分类：F06

资助金额：25.00

项目类别：青年科学基金项目

在线模型选择的增量素描方法

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

二维FM系统的同时故障检测与控制

扶贫资源输入对贫困地区分配公平的影响

张骁的其他基金

拟南芥P1SA1/2调控PHOT1应答强蓝光抑制下胚轴向光弯曲机制分析

一氧化氮调控向光素介导的拟南芥下胚轴向光弯曲反应机制

NOA1调控水杨酸诱导的拟南芥根波动生长机制分析

创业导向、社会资本对服务业企业国际化扩张的影响机制研究

ISG化修饰通过靶蛋白EMD影响肿瘤发生发展机制研究

人力资本对知识密集型服务业企业国际化扩张的影响机制研究：知识基础论视角的阐释与实证

拟南芥SDM1调节脂肪酸在幼苗子叶气孔定位抵御水涝的机制分析

ABA和H2O2/NO调控保卫细胞蓝光信号转导机制分析

H2O2和NO在ABA诱导气孔关闭中的作用

相似国自然基金