生成对抗网络在图像文本跨模态检索中的研究

基本信息

批准号：61862050

项目类别：地区科学基金项目

资助金额：40.00

负责人：刘立波

学科分类：

依托单位：宁夏大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：张鹏,刘昊,邓箴,邹宇晰,程晓龙,郭进祥,徐峰,郑斌

关键词：

多模态数据共享子空间跨模态检索生成对抗网络语义关联优化

结项摘要

It is a typical problem that using a text query to search for image and using a image query to search for text. Convolutional neural network and generative adversarial network have been applied in a wide variety of fields, including image processing and natural language processing and so on, provides a strong basis for modal information retrieval technology. This project study two kinds of model data information retrieval task. This project takes image and text modal data as the research object. This project's purpose is to effectively solve the problem of the construction of image-text common subspace and semantic association between features in subspace is not strong, and to enhance cross-modal retrieval performance. First of all, we used convolution neural network to establish image-text feature projection model and modal classification model, and then used generative adversarial network's idea to construct cross-modal retrieval model .This model can be used to construct image-text common subspace which can integrate the representation learning and the related learning.Secondly, the semantic classifier based on depth classification network and the negative sample constraints are introduced to cross-modal retrieval model for digging deeper into the semantic association features. This method can reduce the loss of semantic information of thie data features, and to ensure the semantic discrimination between the features in the modal in the common subspace at the same time ensure inter-modal semantic consistency.Thirdly, for training the cross-modal retrieval model, we have designed training method and objective function, in order to accomplish the training task of cross-modal retrieval model efficiently. In the end, we use public real data set to validate models in this project, and develop a cross modal retrieval demo system.

图文互检是跨模态检索任务中的典型问题。卷积神经网络、生成对抗网络在图像及自然语言处理等领域的成功应用，为跨模态检索技术提供了有力依据。本项目以图像和文本两种模态数据作为研究对象，期望能够有效解决图文共享子空间构建与子空间中特征间语义关联不强的问题，提升图文跨模态检索性能。为此首先采用卷积神经网络建立图文特征投影模型和模态特征分类器，随后应用生成对抗网络的思想融合二者搭建跨模态检索模型，用以构建将表示学习和关联学习有机统一的图文共享子空间；接着引入基于深度分类网络的语义分类器和负样本约束，深入挖掘图文模态数据的语义关联特征来降低数据特征语义信息的损失，以期在共享子空间中同时保证模态内特征间的语义区分性和模态间特征的语义一致性，并以此为目的设计对应的训练方法和目标函数，期望高效完成跨模态检索模型的训练任务；最后选取公开的真实数据集对本研究构建的各种模型进行验证，并研制一个跨模态检索演示系统。

项目摘要

近年来，文本、图像、视频和音频等不同模态的数据呈现爆炸式增长，单一的数据检索模式已渐渐无法满足用户日益丰富的检索需求。跨模态检索的目标是以某一模态的数据(如文本)作为输入,从数据库中查找与输入相似的其他模态数据(如图像)。然而，由于不同模态数据存在异构性，使得衡量它们之间的相似性变得非常困难。本项目着眼于图像和文本两个模态，针对图文跨模态检索研究中目前存在的问题，将原申请计划内容进行拓展，从单模态表示学习和多模态关联学习、图文共享语义特征的表示学习、模态间特征的一致性及模态内特征的区分性、细粒度图像分类和细粒度图文跨模态检索五个方面展开研究。并将上述方法在自建的超声图文、枸杞虫害图文跨模态检索数据集进行验证，为行业检索应用提供了新方法和新手段。. 依托本项目，累计发表学术论文15篇，包括EI期刊检索3篇，EI会议检索4篇，CSSCI期刊检索1篇，CSCD期刊前15% 3篇，CSCD核心期刊1篇，CSCD扩展版期刊3篇；申请发明专利2项（授权1项）；申请获批软件著作权3项；进行成果登记1项；培养年青教师2名，硕士研究生7名。项目负责人刘立波教授在项目执行期间，2022年入选宁夏科技领军人才、晋升中国计算机学会高级会员。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

刘立波的其他基金

批准号：41174137

批准年份：2011

资助金额：80.00

项目类别：面上项目

批准号：41774161

批准年份：2017

资助金额：71.00

项目类别：面上项目

批准号：40674090

批准年份：2006

资助金额：42.00

项目类别：面上项目

批准号：41231065

批准年份：2012

资助金额：270.00

项目类别：重点项目

批准号：40274054

批准年份：2002

资助金额：30.00

项目类别：面上项目

批准号：49804008

批准年份：1998

资助金额：15.00

项目类别：青年科学基金项目

批准号：41074112

批准年份：2010

资助金额：49.00

项目类别：面上项目

批准号：40574071

批准年份：2005

资助金额：38.00

项目类别：面上项目

相似国自然基金

基于生成对抗网络的释义文本生成研究

批准号：61806075

批准年份：2018

负责人：孔蕾蕾

学科分类：F0606

资助金额：26.00

项目类别：青年科学基金项目

面向网络图像检索的弱监督多模态跨域机器学习方法研究

批准号：61671048

批准年份：2016

负责人：邬俊

学科分类：F0116

资助金额：60.00

项目类别：面上项目

面向文本生成的生成式对抗网络算法与理论研究

批准号：61773362

批准年份：2017

负责人：兰艳艳

学科分类：F0605

资助金额：64.00

项目类别：面上项目

基于跨层次生成对抗网络的移动端图像超分辨率研究

批准号：61871284

批准年份：2018

负责人：陈瑞

学科分类：F0116

资助金额：63.00

项目类别：面上项目

生成对抗网络在图像文本跨模态检索中的研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于多色集合理论的医院异常工作流处理建模

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于腔内级联变频的0.63μm波段多波长激光器

刘立波的其他基金

中低纬电离层夜间特性及其机理研究

电离层暴时响应的半球不对称性

中低纬电离层气候学特征的高度依赖

低纬电离层天气扰动特征及其对太阳风的响应

低纬电离层与风场的动力耦合研究

利用电离层特性数据研究低纬等效电场

低太阳活动条件下中低纬电离层剖面结构

低纬电离层暴特征的统计分析

相似国自然基金