本项目将针对机器学习技术用于在线媒体内容分类与标注所面临的四个重要问题进行研究。首先,传统机器学习技术假设可以事先获取样本的所有特征信息,而提取所有特征将导致高时间开销,如何高效地为不同对象自适应地提取不同特征进行学习?第二,传统机器学习技术假设训练样本类别标记已知,而媒体对象往往同时属于多个类别且很难获得完全的类别信息,如何有效地基于弱标记样本进行多标记学习?第三,传统机器学习技术假设所有样本处于相同空间、符合相同分布,而不同用户对媒体对象的关注往往不同,如何针对用户需求与样本自身特性进行查询敏感学习?第四,传统机器学习技术假设样本空间具有度量性,而媒体标注涉及的用户认知距离往往具有非度量性,如何有效地基于非度量距离进行半监督学习?本项目将为上述问题提供解决方案并研制原型系统,在重要国际期刊、一流国际会议和国内一级学报发表论文8-10篇,申请国家发明专利2-3项,培养多名研究生。
本项目对机器学习技术用于在线媒体内容分类与标注所面临的问题进行研究,完成了原定研究计划,主要取得了以下成果:(1)提出了能自适应地根据样本特性进行特征抽取的方法;(2)提出了能基于弱标记样本进行有效多标记学习的方法;(3)提出了能针对用户需求与样本自身特性进行查询敏感学习的方法;(4)提出了能有效地基于非距离度量进行半监督学习的方法;(5)设计并实现了原型系统。本课题共发表/录用论文50篇,其中国际期刊论文22篇(包括4篇《Artificial Intelligence》、2篇《Journal of Machine Learning Research》、12篇《ACM/IEEE Transactions》),国际会议论文25篇(包括CCF A类国际会议16篇),国内重要期刊论文3篇。论文已被SCI、EI、ISTP收录59篇次。获ACM GECCO’11最佳理论论文奖、ACM SIGKDD’12最佳墙展奖、IJCAI’13最佳报告奖、3次全国性会议论文奖,PAKDD2012数据挖掘竞赛总冠军;出版英文专著1部,主持国际期刊专辑3期;获国家发明专利3项,申请国家发明专利4项;培养了多名研究生,2篇博士论文获CCF优秀博士学位论文奖。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
适于图像分类与标注的安全机器学习技术研究
适于移动设备的机器学习技术研究
基于机器学习的多义性数据概念标注研究
大规模机器学习的在线方法与实现