面向众包标注的真值推断与监督分类关键问题研究

基本信息

批准号：61603186

项目类别：青年科学基金项目

资助金额：22.00

负责人：张静

学科分类：

依托单位：南京理工大学

批准年份：2016

结题年份：2019

起止时间：2017-01-01 - 2019-12-31

项目状态：已结题

项目参与者：夏彬,倪铭,吴铭,许小强,崔诗程,陈晗婧,王笑

关键词：

分类真值推断主动学习众包含噪样本学习

结项摘要

Recently, data annotation tasks can be completed by ordinary Internet users through crowdsourcing platforms. Since labeling qualities of labelers in crowdsourcing are different, supervised learning from these crowdsourced labeled data is full of challenges. This proposal focuses on ground truth inference and supervised learning for crowdsourcing from the aspect of machine learning, providing novel theories and methods for building supervised classification learning systems based on crowdsourced labeled data. Based on the classic statistical-query learnable theory and considering the specific characteristics of crowdsourcing, we first study the relationship among sample features, classifiers, labeling qualities, the performance of ground truth inference algorithms, and the qualities of learned models, and then build up a set of fundamental theories which can supervise ground truth inference and model training. Secondly, in order to improve the quality of integrated labels, we study novel algorithms for multi-class ground truth inference which are based on the fusion of concept-level features and physical-level features of examples, and novel methods which can correct integrated mislabeled examples. Thirdly, in order to improve the performance of learned models under an active learning paradigm, we study finer-grain sampling strategies, labeling optimization methods and labeler selection strategies based on temporal modeling for labeling qualities. Finally, we build up a prototype system for ground truth inference and supervised classification, using crowdsourced data to verify practical values of our research outcomes.

近年来，数据标注任务可以方便地通过众包平台由互联网上的普通用户完成。由于众包标注者的标注质量参差不齐，利用众包标注数据进行监督学习模型训练充满挑战。本项目致力于研究众包标注数据机器学习中真值推断与监督分类问题，为基于众包标注数据构建监督分类学习系统提供新理论与新方法。首先，从经典的统计查询可学习理论出发，结合众包标注相关特性，研究预算约束条件下，样本特征、分类器、标注者质量与真值推断性能及学习模型质量之间的关系，建立指导真值推断和模型训练的基础理论；其次，研究基于样本“概念层”与“物理层”特征融合的多分类真值推断算法和“集成误标”样本标签纠正方法，以提高集成标签质量；再次，研究主动学习范式下更加精细的样本选择策略、标签优化方法以及基于标注质量时序建模的标注者选择策略，以提高学习模型的性能。最后，构建面向众包标注的真值推断与监督分类的原型系统，以验证研究成果的应用价值。

项目摘要

众包环境的不确定性使得利用众包标注数据进行机器学习充满挑战。项目聚焦面向众包标注的真值推断与监督分类中的关键问题。首先，研究了众包标签真值推断算法。针对偏置标注，提出适应性加权多数投票推断算法，平衡了标注者对两类样本的投票权重。针对多分类多标签任务，提出基于混合多努利分布的推断算法以发掘并利用标签之间的相关性。针对样本和标签稀疏性，提出单一参数建模标注者质量与样本难度的鲁棒性推断模型。这些算法显著提升了真值推断的准确度。其次，研究了基于标签噪声纠正的标签集成方法。提出迭代双层聚类标签集成算法，通过对概念层和物理层特征进行交叉聚类分析，发现并纠正概念层集成标签中的误标。提出基于模型预测标签噪声纠正的标签集成算法，通过高标签质量样本构建的集成学习模型发现并纠正低标签质量样本中的误标。再次，研究了面向众包标注数据的精细化预测模型学习方法。提出四种众包噪声标签利用方法和基于样本复制的集成学习算法，提升了预测模型的泛化性能。提出三种主动学习样本选择策略，降低了标注成本。最后，以开源软件的形式将项目原型系统中的核心算法和数据向研究社区开放。研究成果推进了人机协同人工智能的发展且具备广泛的应用前景。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2022

DOI：10.3724/sp.j.1089.2022.19009

发表时间：2022

DOI：

发表时间：2019

DOI：10.19818/j.cnki.1671-1637.2021.05.022

发表时间：2021

DOI：

发表时间：2021

张静的其他基金

批准号：61871082

批准年份：2018

资助金额：63.00

项目类别：面上项目

批准号：31370309

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：81372783

批准年份：2013

资助金额：72.00

项目类别：面上项目

批准号：31301615

批准年份：2013

资助金额：22.00

项目类别：青年科学基金项目

批准号：11874249

批准年份：2018

资助金额：46.00

项目类别：面上项目

批准号：11871023

批准年份：2018

资助金额：50.00

项目类别：面上项目

批准号：31301277

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：11201147

批准年份：2012

资助金额：22.00

项目类别：青年科学基金项目

批准号：51271207

批准年份：2012

资助金额：68.00

项目类别：面上项目

批准号：81400988

批准年份：2014

资助金额：22.00

项目类别：青年科学基金项目

批准号：51466008

批准年份：2014

资助金额：25.00

项目类别：地区科学基金项目

批准号：41706157

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：61102167

批准年份：2011

资助金额：24.00

项目类别：青年科学基金项目

批准号：30400213

批准年份：2004

资助金额：20.00

项目类别：青年科学基金项目

批准号：11504218

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：81900889

批准年份：2019

资助金额：21.00

项目类别：青年科学基金项目

批准号：61007011

批准年份：2010

资助金额：22.00

项目类别：青年科学基金项目

批准号：81760048

批准年份：2017

资助金额：34.00

项目类别：地区科学基金项目

批准号：11104072

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

批准号：10979054

批准年份：2009

资助金额：36.00

项目类别：联合基金项目

批准号：11401108

批准年份：2014

资助金额：22.00

项目类别：青年科学基金项目

批准号：81500868

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：81860444

批准年份：2018

资助金额：37.00

项目类别：地区科学基金项目

批准号：61702522

批准年份：2017

资助金额：29.00

项目类别：青年科学基金项目

批准号：81341098

批准年份：2013

资助金额：10.00

项目类别：专项基金项目

批准号：51405401

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：11801254

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：51505319

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：51471038

批准年份：2014

资助金额：85.00

项目类别：面上项目

批准号：21502107

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：81301132

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：61402174

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：81660547

批准年份：2016

资助金额：33.00

项目类别：地区科学基金项目

批准号：41872084

批准年份：2018

资助金额：66.00

项目类别：面上项目

批准号：91846104

批准年份：2018

资助金额：43.00

项目类别：重大研究计划

批准号：40806030

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：31800380

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：51608162

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：71303156

批准年份：2013

资助金额：20.00

项目类别：青年科学基金项目

批准号：61405028

批准年份：2014

资助金额：26.00

项目类别：青年科学基金项目

批准号：81100060

批准年份：2011

资助金额：20.00

项目类别：青年科学基金项目

批准号：21205015

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：81000013

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：30360027

批准年份：2003

资助金额：15.00

项目类别：地区科学基金项目

批准号：81400264

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：31901970

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：41261073

批准年份：2012

资助金额：50.00

项目类别：地区科学基金项目

批准号：81173025

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：61674003

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：20803082

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：51704243

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：21573101

批准年份：2015

资助金额：66.00

项目类别：面上项目

批准号：50301018

批准年份：2003

资助金额：8.00

项目类别：青年科学基金项目

批准号：U1404810

批准年份：2014

资助金额：30.00

项目类别：联合基金项目

批准号：61101209

批准年份：2011

资助金额：19.00

项目类别：青年科学基金项目

批准号：31700814

批准年份：2017

资助金额：17.00

项目类别：青年科学基金项目

批准号：41867073

批准年份：2018

资助金额：40.00

项目类别：地区科学基金项目

批准号：81572545

批准年份：2015

资助金额：40.00

项目类别：面上项目

批准号：31900172

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：30300299

批准年份：2003

资助金额：19.00

项目类别：青年科学基金项目

批准号：81402629

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：41103062

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：51508353

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：31872001

批准年份：2018

资助金额：61.00

项目类别：面上项目

批准号：31701360

批准年份：2017

资助金额：26.00

项目类别：青年科学基金项目

批准号：11701127

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：31402300

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：81203000

批准年份：2012

资助金额：22.00

项目类别：青年科学基金项目

批准号：21404091

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：81273084

批准年份：2012

资助金额：60.00

项目类别：面上项目

批准号：81600028

批准年份：2016

资助金额：18.00

项目类别：青年科学基金项目

批准号：40901026

批准年份：2009

资助金额：22.00

项目类别：青年科学基金项目

批准号：81070582

批准年份：2010

资助金额：28.00

项目类别：面上项目

批准号：31400050

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：21876190

批准年份：2018

资助金额：66.00

项目类别：面上项目

批准号：11702004

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：21707096

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：41401117

批准年份：2014

资助金额：26.00

项目类别：青年科学基金项目

批准号：81670030

批准年份：2016

资助金额：60.00

项目类别：面上项目

批准号：21101169

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：31300882

批准年份：2013

资助金额：21.00

项目类别：青年科学基金项目

批准号：51878095

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：71603265

批准年份：2016

资助金额：18.00

项目类别：青年科学基金项目

批准号：29672024

批准年份：1996

资助金额：9.00

项目类别：面上项目

批准号：81660492

批准年份：2016

资助金额：37.00

项目类别：地区科学基金项目

批准号：40502012

批准年份：2005

资助金额：27.00

项目类别：青年科学基金项目

批准号：20903054

批准年份：2009

资助金额：19.00

项目类别：青年科学基金项目

批准号：51304173

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：31201538

批准年份：2012

资助金额：22.00

项目类别：青年科学基金项目

批准号：81101748

批准年份：2011

资助金额：22.00

项目类别：青年科学基金项目

批准号：61405024

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：81401149

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：41271004

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：21171134

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：21105006

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：50643012

批准年份：2006

资助金额：9.00

项目类别：专项基金项目

批准号：21041001

批准年份：2010

资助金额：10.00

项目类别：专项基金项目

批准号：39370297

批准年份：1993

资助金额：5.00

项目类别：面上项目

批准号：81671400

批准年份：2016

资助金额：60.00

项目类别：面上项目

100

批准号：51508152

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

101

批准号：39070388

批准年份：1990

资助金额：3.00

项目类别：面上项目

102

批准号：11375229

批准年份：2013

资助金额：96.00

项目类别：面上项目

103

批准号：81402467

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

104

批准号：41572065

批准年份：2015

资助金额：80.00

项目类别：面上项目

105

批准号：81801316

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

106

批准号：51201071

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

107

批准号：81500230

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

108

批准号：81470231

批准年份：2014

资助金额：70.00

项目类别：面上项目

相似国自然基金

面向海量数据语义标注众包的任务管理方法研究

批准号：71401096

批准年份：2014

负责人：郝晓玲

学科分类：G0112

资助金额：20.00

项目类别：青年科学基金项目

基于众包标注的多标记学习研究

批准号：61906089

批准年份：2019

负责人：李绍园

学科分类：F0603

资助金额：24.00

项目类别：青年科学基金项目

面向多类不相容标注的真值推理与模型获取研究

批准号：61876217

批准年份：2018

负责人：崔志明

学科分类：F0605

资助金额：64.00

项目类别：面上项目

面向多类图像分类的众包主动学习方法研究

批准号：61402311

批准年份：2014

负责人：吴健

学科分类：F0210

资助金额：26.00

项目类别：青年科学基金项目

面向众包标注的真值推断与监督分类关键问题研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

一种改进的多目标正余弦优化算法

多源数据驱动CNN-GRU模型的公交客流量分类预测

面向工件表面缺陷的无监督域适应方法

张静的其他基金

面向城域网数据中心互联的高速直接探测光纤传输系统关键技术研究

生长素与脱落酸通过氧化还原调控植物根尖干细胞维持和分化的分子机制

肿瘤微环境巨噬细胞促进VCAM-1介导卵巢癌细胞侵袭及腹腔转移的研究

真菌病毒ArHV及其与Amphobotrytis ricini耐高温的关系研究

光力学系统中多组份纠缠态的产生

无界系统的KAM理论和有效稳定性理论及其应用

套作大豆高效利用水分的生理机理研究

无界系统的KAM理论和Birkhoff正规形理论及其应用

孪晶结构镁基单相固溶体合金的变形与力学行为研究

MicroRNA-155调节CD4+T细胞分化并与多发性硬化发病机制相关

双流道叶轮三维逆向水力设计方法研究

大黄鱼细胞遗传图谱的构建和初步应用

基于稀疏表示的超高分辨率SAR图像变形目标识别的K-SVD方法研究

乙型肝炎病毒HBx、MHBst基因在乙型肝炎病毒相关性肾炎中的作用机制研究

开放原子-光力学系统中的量子关联

Aim1在视网膜感光细胞纤毛形成中的作用及机制研究

基于矢量量化的高光谱遥感图像压缩编码技术研究

基于Parkin介导的线粒体自噬探讨七氟烷后处理对糖尿病心肌缺血再灌注损伤的作用机制

新型钙钛矿铁电体的非线性光学和输运性质研究

高温水中表面修饰氧化铈纳米粒子的同步辐射研究

随机偏微分方程及其障碍问题的研究

mTOR信号通路在口腔扁平苔藓T细胞免疫应答中的作用研究

MeCP2/HDAC1募集DNMT3A表观调控AR转录促进肝癌细胞的迁移侵袭

基于信任影响力的社会推荐方法研究

局部的星形胶质细胞老化对室管膜下区神经发生的影响

环境风下高速弓网的滑动接触特性及优配设计研究

极小弱拓扑群若干问题的研究

太阳能电池阵大转角大扭矩柔性铰链优化设计及动力学特性研究

合金元素调控镁中变形孪晶形核与生长的基础研究

基于非手性芘的超分子手性圆偏振发光材料

NRSF-CART在缺血性脑损伤疾病修复中的作用研究

融合社交语义环境的网络图像标注关键技术研究

香烟烟雾暴露对雄性大鼠的生殖毒性及仔鼠学习记忆的影响

东天山古生代浅成低温热液金矿床的形成及保存：以马庄山金矿为例

众包大数据多源异构融合与知识学习

咪唑啉双季铵盐的研制及其在碳钢表面的吸附与缓蚀机理研究

西藏高寒草原植物菌根真菌和吸收根氮获取的权衡机制研究

基于S时频变换的桥梁结构非线性模型模式识别与参数确定

基于社区实践的中小学生肥胖循证健康管理研究

具有时间反转效应的实时数字全息成像理论及应用研究

睡眠呼吸暂停模式间歇低氧诱发心脏损伤机制及抗氧化干预的研究

基于无酶循环放大策略的多通道纳米电化学生物传感器用于肝癌多元肿瘤标志物的联合检测

多功能蛋白聚糖1在COPD肺弹性纤维丧失中的作用

酵母基因内含子中转录调控位点的统计性质研究

miR-106b对动脉粥样硬化斑块稳定性的影响及其作用机制的研究

AcSUSY1在调控猕猴桃果实蔗糖卸载能力与库强中的功能研究

西藏高寒湿地系统营养元素的生物地球化学过程

基于同位素多模板MIP-LC-MS技术的复杂体系中痕量雌激素分析新方法的研究

Ge基MOS器件迁移率的远程库伦散射机制的研究

表面吸附作用调控纳米晶“取向结合”生长动力学及其在尺寸控制中的应用

镍基高温合金中温变形动态析出前期相和反位缺陷的协同演变历程.

催化剂表面异相结与光催化性能构效关系的研究

高锌新型Mg-Al-Zn基镁合金的研究

Golden-talen技术构建斑马鱼稳定敲除品系研究Trx2功能缺陷在帕金森病诱发中的作用

多天线信道时变特征参数的非线性滤波技术研究

炎性微环境下TGF-β1/Treg相关细胞因子介导的免疫调控在骨髓间充质干细胞骨向分化中作用机制研究

青海木里煤田矿区人工植被种群自我更新与调控对策研究

SIRT1亚细胞定位与卵巢癌顺铂耐药研究

苜蓿复叶初级形态建成关键调控因子PPF2的分子机制研究及在苜蓿品质改良中的应用

应用酵母双杂交系统研究轮状病毒与宿主细胞相互作用的分子机制

基于AMPK/mTOR通路调控在微波辐射引起心肌细胞线粒体自噬中作用的基础研究

硫素对土壤-水稻中砷的迁移转化影响机制研究

纳米双金属复合氧化物催化臭氧的效能及机理研究

土槿皮乙酸对植物病原真菌的抑菌作用靶标研究

油菜不同根系构型对干旱胁迫的响应及其调控机制研究

非对称狄氏型在边值问题和马氏过程大偏差中的应用

我国海带栽培品种（系）线粒体基因组遗传分化研究

藏药红景天“预适应”对缺氧脑损伤神经保护及其线粒体MPTP机制探讨

肿瘤诱导靶向型癌症联合治疗系统的研究

儿童孤独症早期预警模型的建立与验证