The diversification of visual data generation mode and generation type led to the explosive growth of Visual data quantity with huge amount of data. In the face of complicated, unstructured and massive amounts of visual data, it is too difficult to use a common framework to resolve processing of complex structured data. For effective management and use of these mass distributions of visual data, visual content-based information retrieval and data mining have gradually become research area of concern. How to understand the topic of the visual data is critical. In this project, the theory of topic model is introduced. The visual feature representation, extraction and the visual words associativity will be studied. The algorithms of the visual topic model building and learning will be completed. The purpose of the research is break down the diversity and low density value that hamper visual data analysis, and to build a fast visual data understanding algorithm based on visual topic model. The new model is not only a theoretical exploration but also an experiment being carried out in the application of visual data.
大数据环境下,视觉数据生成方式和生成类型的多样化,使视觉数据量呈爆炸式增长。面对复杂的、非结构化的、海量的视觉数据,如何有效的对这些数据加以利用是目前急需解决的问题。对视觉数据加以利用,首先要解决的是视觉数据特征的提取,进行视觉信息的分析和分类。如何快速理解视觉信息表达的主题,是对视觉数据进行分析和分类的关键。课题引入文本理解中主题模型的思想,研究视觉特征的表达、视觉词汇的提取、视觉词汇在出现的时间、空间和频率上与视觉主题的关联性;构建视觉主题模型及主题学习算法和主题理解算法。研究旨在克服视觉数据体量巨大、数据类型多样、价值密度低的影响,形成视觉特征的快速提取技术,建立标准的视觉词汇集,利用文本理解和分类的思想,发展基于视觉主题模型的视觉语义理解技术,构建视觉数据的索引和分类实例。理论上将文本提取主题的思想应用到大容量视觉数据的分析中是一个新的探索,在应用上是探索解决视觉数据应用的关键。
大数据环境下,视觉数据生成方式和生成类型的多样化,使视觉数据量呈爆炸式增长。面对复杂的、非结构化的、海量的视觉数据,如何有效的对这些数据加以利用是目前急需解决的问题。对视觉数据加以利用,首先要解决的是视觉数据特征的提取,进行视觉信息的分析和分类。如何快速理解视觉信息表达的主题,是对视觉数据进行分析和分类的关键。.本课题将主题模型的思想引入到动态视觉场景的理解中,将一组动态视觉场景类比为一篇文档,研究视觉特征的表达、视觉词汇的提取、视觉词汇在出现的时间、空间和频率上与视觉主题的关联性;视觉词汇在空间和时间上的有序分布形成了视频或者图像,表达了不同的视觉主题,构建视觉主题模型及主题学习算法和主题理解算法。研究旨在克服视觉数据体量巨大、数据类型多样、价值密度低的影响,形成视觉特征的快速提取技术,建立标准的视觉词汇集,利用文本理解和分类的思想,发展基于视觉主题模型的视觉语义理解技术,构建视觉数据的索引和分类实例。.在项目研究过程,设计了视觉词汇的识别、提取和表示算法;建立一种因为运动造成的视觉词汇中的视觉信息丢失的补偿机制,从而使词汇中的视觉信息和动态信息能够完整的表达原动态视觉场景;借助于视觉认知过程中的分层机制,从视觉局部认知与全局认知的角度,建立视觉主题的概率模型;基于学习算法中已经建立起来的各主题与视觉词汇间的关系,设计视觉主题的理解算法。.理论上将文本提取主题的思想应用到大容量视觉数据的分析中是一个新的探索,分析了视觉词汇与视觉内容的关系。在应用上是探索解决视觉数据应用的关键,实现快速、高效的从大规模视觉数据中理解其内容。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
基于SSVEP 直接脑控机器人方向和速度研究
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于机器视觉的监控视觉数据智能分析
大数据环境下稀疏主题模型理论及其应用研究
面向大数据环境的高通量视觉计算
大数据环境下基于GMDH的客户分类半监督集成模型研究