基于众包标注的多标记学习研究

基本信息
批准号:61906089
项目类别:青年科学基金项目
资助金额:24.00
负责人:李绍园
学科分类:
依托单位:南京航空航天大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
弱标记学习多标记学习众包标注 标记关系
结项摘要

Multi-label learning deals with examples simultaneously associated with multiple labels. While multi-label tasks are ubiquitous in practical applications, it's often difficult to collect the true labels for training data. By distributing the tasks to multiple easy to access non-experts, crowdsourcing provides a fast and flexible alternative to collecting labeling information. This project proposes to study on multi-label crowdsourcing learning problem, and learn from multi-label training data labeled by crowds. The research contents include: 1) proposing methods to make robust use of label correlations, which tackle the label correlation estimation difficulties in the crowdsourcing scenario; 2) proposing methods to learn from low quality annotations, which complement existing learning methods that require all labels annotated for the tagged instances; 3) proposing method to actively collect annotations and learning from them, which address the inefficiency and high cost of existing annotation collection strategies. Our project provides novel directions for multi-label crowdsourcing learning. It is expected to publish 4-6 papers on high quality journals or conferences and apply 1-2 patents.

多标记学习研究一个样本同时与多个标记相关联的学习问题。在实际应用中,多标记学习的任务普遍存在,而收集训练数据的真实标记往往很困难。通过将任务分配给多个易于访问但可能犯错的非专家,众包提供了一种快速灵活的标记收集方式。本项目针对多标记众包学习问题进行研究,从众包标注的多标记训练数据中学习分类模型。主要研究内容包括:(1)针对众包设定下标记关系利用困难的问题,提出面向鲁棒关系利用的多标记众包方法;(2)针对现有学习方法过于单一、要求被标注样本的所有标记的问题,提出适用于低质标注数据的多标记众包方法;(3)针对现有标注收集策略低效、浪费成本的问题,提出基于主动众包标注的多标记众包方法。本项目为多标记众包学习开辟了新的思路和方向,成果有望在国内外重要学术期刊和会议上发表高质量论文4-6篇,并申请专利1-2项。

项目摘要

多标记学习研究一个样本同时与多个标记相关联的学习问题。在实际应用中,多标记学习的任务普遍存在,而收集训练数据的真实标记往往很困难。通过将任务分配给多个易于访问但可能犯错的非专家,众包提供了一种快速灵活的标记收集方式。本项目针对这一问题进行研究,提出面向鲁棒关系利用的多标记众包方法;提出适用于低质标注数据的多标记众包方法;提出基于主动众包标注的多标记众包方法。相关成果发表高水平论文5篇,申请专利4项,培养研究生3名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

DOI:10.3724/ SP.J.1123.2019.04013
发表时间:2019
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

李绍园的其他基金

相似国自然基金

1

基于众包标注的多元时间序列流早期预警及其应用

批准号:61876136
批准年份:2018
负责人:何国良
学科分类:F0605
资助金额:62.00
项目类别:面上项目
2

众包大数据多源异构融合与知识学习

批准号:91846104
批准年份:2018
负责人:张静
学科分类:F0605
资助金额:43.00
项目类别:重大研究计划
3

面向多类图像分类的众包主动学习方法研究

批准号:61402311
批准年份:2014
负责人:吴健
学科分类:F0210
资助金额:26.00
项目类别:青年科学基金项目
4

面向海量数据语义标注众包的任务管理方法研究

批准号:71401096
批准年份:2014
负责人:郝晓玲
学科分类:G0112
资助金额:20.00
项目类别:青年科学基金项目