数据驱动的大规模图像自动标注关键技术研究

基本信息
批准号:61271394
项目类别:面上项目
资助金额:88.00
负责人:丁贵广
学科分类:
依托单位:清华大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:刘英博,林梓佳,龙明盛,张君,秦锴,章艳萍,文海龙,于琰,董欣鹏
关键词:
数据驱动图像检索图像标注
结项摘要

With the explosive growth of online community and image sharing websites, a huge amount of images with few tags or no tags are being generated on the Web. This tag-incompleteness has posed a great challenge to the keyword-based image retrieval methods and systems. Data-Driven Image Auto-Annotation (DD-IAA) is an effective process for extracting semantic features from images. To automatically predict image tags, DD-IAA learns the latent relationship (mapping) between the semantic concept space and the visual feature space by leveraging the Web as an infinite semantic repository and knowledge base, and utilizing a variety of techniques in data mining, machine learning and computer vision. DD-IAA is a newly-emerged research area. It involves many fundamental theories and practical techniques, which makes its research significant in theory and useful in application. However, the existing methods for image auto-annotation have not yet been matured to support the tagging of large-scale Web images. To tackle this difficulty, in this project, we will make an in-depth study on DD-IAA. Our major research content includes: construction and maintenance of a Web image knowledge base; Web image tag processing; candidate tag selection and propagation, etc. With our own developed key techniques and algorithms, we will implement a semantic-aware image retrieval system based on DD-IAA. We aim to make some theoretical achievements, develop several novel techniques, and lay solid foundation on both theories and techniques for this kind of technology.

随着网络社区和图像共享网站的发展,网络中产生大量无标签或有很少标签的图像,这给基于关键词的图像检索方法带来了新的挑战。数据驱动的图像自动标注技术是一种有效的图像语义特征提取技术,其利用互联网这个近乎无限的语义仓库和知识仓库,通过数据挖掘、机器学习、计算机视觉等技术自动学习语义概念空间与视觉特征空间的潜在关联或者映射关系,来预测图像的标注。该技术是一个新兴的研究领域,包括众多基础理论和实用技术,其研究具有重要理论意义和广泛应用价值。现有图像自动标注技术尚不能满足大规模网络图像的标注需求,本项目将对数据驱动的图像自动标注技术展开研究,主要研究内容有:网络图像知识库构建与维护、网络图像标签处理、候选标签选择及传播等,并在以上关键技术与算法研究的基础上,研发基于自动标注技术的图像语义检索系统。本项目力争在图像自动标注的理论上有所突破,在技术方法上有所创新,为该项技术的理论研究和实际应用奠定基础。

项目摘要

图像标注是指通过计算机视觉、机器学习、数据挖掘等方法,让计算机自动地、客观地为图像数据添加能够准确描述其语义内容的文本标签。数据驱动的图像自动标注技术是利用互联网这个近乎无限的语义仓库和知识仓库,实现图像语义特征提取的方法。本项目对数据驱动的图像自动标注技术开展了深入分析与算法研究,主要研究内容有:网络图像知识库构建与图像K近邻检索技术、图像标签补全与去噪技术、候选标签选择及传播技术等,并在以上关键技术与算法研究的基础上,设计开发图像近邻查询与标注系统。在项目执行期间,提出了多种基于哈希的图像K近邻检索方法、基于线性稀疏重构的图像标签补全方法、多源环境下的图像自动标注方法、基于标签依赖随机搜索的图像标注方法等。项目执行期间,发表/录用论文26篇,包括IEEE Trans. Image Processing, IEEE Transactions on Cybernetics, IEEE Transactions on Multimedia, IEEE Transactions on Knowledge and Data Engineering等SCI期刊论文7篇,CVPR、ICCV、AAAI、IJCAI、ICML、SIG IR等CCF A类会议论文13篇,相关论文Google Scholar引用200余次;申请发明专利4项,其中1项已经获得授权;培养硕士博士研究生15名,其中4名学生先后获得清华大学优秀毕业论文。项目执行后期,对基于深度模型的图像描述技术进行了扩展研究,提出了基于参考LSTM的图像描述解决方案,在MS COCO数据集上的评测结果证明了方法的有效性,也为本项目的后续研究奠定了良好基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

基于二维材料的自旋-轨道矩研究进展

基于二维材料的自旋-轨道矩研究进展

DOI:10.7498/aps.70.20210004
发表时间:2021
5

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021

丁贵广的其他基金

批准号:61571269
批准年份:2015
资助金额:66.00
项目类别:面上项目
批准号:60502014
批准年份:2005
资助金额:25.00
项目类别:青年科学基金项目
批准号:60972096
批准年份:2009
资助金额:33.00
项目类别:面上项目

相似国自然基金

1

大规模图像数据自动标注算法研究

批准号:60873178
批准年份:2008
负责人:薛向阳
学科分类:F0605
资助金额:30.00
项目类别:面上项目
2

图像数据驱动的三维模型集标注技术研究

批准号:61602139
批准年份:2016
负责人:吴子朝
学科分类:F0209
资助金额:20.00
项目类别:青年科学基金项目
3

维吾尔民俗图像的双语自动标注与检索关键技术研究

批准号:61262065
批准年份:2012
负责人:古丽松·那斯尔丁
学科分类:F0605
资助金额:43.00
项目类别:地区科学基金项目
4

大规模标注RDF数据管理的关键技术研究

批准号:61073096
批准年份:2010
负责人:袁平鹏
学科分类:F0211
资助金额:30.00
项目类别:面上项目