本项目将针对机器学习技术用于在移动设备上进行基于内容的信息检索所面临的四个问题进行研究:首先,移动设备仅提供有限资源,而传统的监督特征抽取技术开销大,如何在标记样本极少时高效地为不同样本提取不同特征用于检索?其次,用户需要系统能够对其提交的查询作出准实时的反应,而利用传统的学习方法对大规模数据进行检索时往往消耗大量的时间,如何提高学习的效率,对用户的查询作出快速的反应?第三,移动信息检索中不同用户有着各自的偏好,而传统学习技术忽略了其对检索结果的影响,如何在学习方法中考虑用户偏好,同时考虑移动计算环境的局限性,实现用户自适应?第四,用户的需求会随着时间推移而发生变化,而目前学习技术大多数针对固定概念进行学习,如何在有限资源情况下,针对随时间迁移的概念进行学习?本项目将为上述问题提供解决方案并研制原型系统,发表国际期刊/会议和国内一级学报论文5-8篇,申请专利1-2项,培养2名研究生。
本项目开展三年以来,对机器学习技术用于在移动上进行基于内容的信息检索所面临的有限资源情况下特征抽取、准实时查询、用户自适应学习和概念迁移学习等四个问题分别进行了深入研究。1. 针对有限资源下特征抽取问题,提出了一种利用少量标记样本、根据样本对特性进行距离度量学习和特征抽取的学习方法,并提出了一种利用抽取代价小的弱模态特征进行学习的序列化特征使用方法,相关工作分别发表在重要国际期刊《ACM Trans. KDD》、顶级国际期刊《IEEE Trans. IFS》(CCF A类)和重要国际会议IScIDE'12上;2. 针对准实时查询问题提出了一种新型选择性集成方法,缩减了模型复杂度,能用于提升准实时查询效率,相关工作发表在多分类器领域重要国际会议MCS’13;3. 针对用户自适应学习问题提出一种能够整合多种额外的用户、场景信息的图模型,并给出有效学习方法,能够对多模态信息加以利用。相关工作发表在顶级国际会议IJCAI’13(CCF A类)上;4. 针对概念迁移问题,提出了一种概念迁移情境下的多示例学习方法,相关工作发表在顶级国际会议AAAI’14(CCF A类)上。..本项目共发表论文14篇,其中在包括《IEEE Trans. IFS》(CCF A类)、《ACM Trans. KDD》等在内的顶级国际期刊上发表论文5篇;在包括IJCAI’13(CCF A类)、AAAI’14(CCF A类)等顶级国际会议上发表论文9篇;已发表论文SCI收录4篇,EI收录13篇。围绕核心技术,项目申请专利1项。研制对场景进行自动多标记标注的移动应用原型系统1个,可以用于基于内容的图像信息查询。..以该项目为支撑,课题组培养8名研究生,其中4名已毕业;培养山东大学计算机学院访问博士研究生1名。截至目前,项目已经完成预期任务,达到结题指标。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
适于图像分类与标注的安全机器学习技术研究
适于在线媒体内容分类与标注的机器学习技术的研究
基于移动设备的高效行为感知识别技术研究
移动云服务中轻量级设备隐私保护技术研究