How to perform efficient semantic understanding of big visual data in internet and “internet of things (IOT)” is a major technical bottleneck for national public security, smart city construction and information industry development. A key scientific problem is the compact representation of big visual data including feature extraction and feature selection, which has a great impact on the performance of subsequent classification algorithms. This project makes use of large scale biometric recognition and image classification as examples of big visual data, and focuses on the structure prior contained in the big visual data. This project studies the compact representation of big visual data with structured constraints and studies the following three problems: First, since the distribution of the examples and labels of big visual data has a geometrical structure, we study fast feature selection algorithms based on the geometrical structure. Second, big visual data will be influenced by noise inevitably and the real structure as well as semantic information will be hided. Thus, we aim to study robust and efficient feature selection methods. Finally, making use of the multi-view feature of big visual data, we aim to construct a unified framework for feature extraction and feature selection based on structure sparsity. We aim to make the performance of the system optimal. This project aims to propose compact representation theory and methods of big visual data with structured constraints, to breakthrough the bottleneck of semantic understanding of big visual data in the efficiency and robustness, and promote the industrial development and related applications of big visual data in our country.
如何对互联网和物联网泛在的视觉大数据进行高效语义理解是国家公共安全、智慧城市建设和信息产业发展面临的重大技术瓶颈,其中一个关键科学问题就是视觉大数据的简洁表示包括特征选择和抽取,决定后续分类识别算法的性能。本项目以视觉大数据包括大规模生物特征识别和图像分类为研究对象,以其中隐含的先验结构信息为切入点,研究基于结构约束的简洁表示,重点研究以下三个问题:首先,视觉大数据的样本和标号的分布,是具有几何结构的,针对其几何结构特点,研究快速特征选择算法;其次,视觉大数据不可避免会受到噪音影响,掩盖其真实结构和语义信息,因此拟研究鲁棒高效的特征选择方法;最后,利用视觉大数据的多视角特征,建立基于结构化稀疏的特征抽取和选择的一体化框架,使整个系统性能最优。本项目将建立基于结构约束的视觉大数据简洁表示理论和方法,突破视觉大数据语义理解在实时性和鲁棒性方面的技术瓶颈,推动我国视觉大数据相关应用和产业发展。
如何对互联网和物联网泛在的视觉大数据进行高效语义理解是国家公共安全、智慧城市建设和信息产业发展面临的重大技术瓶颈,其中一个关键科学问题就是视觉大数据的简洁表示包括特征选择和抽取,决定后续分类识别算法的性能。本项目以视觉大数据包括大规模生物特征识别和图像分类为研究对象,以其中隐含的先验结构信息为切入点,研究基于结构约束的简洁表示,重点研究以下三个问题:首先,视觉大数据的样本和标号的分布,是具有几何结构的,针对其几何结构特点,研究快速特征选择算法;其次,视觉大数据不可避免会受到噪音影响,掩盖其真实结构和语义信息,因此拟研究鲁棒高效的特征选择方法;最后,利用视觉大数据的多视角特征,建立基于结构化稀疏的特征抽取和选择的一体化框架,使整个系统性能最优。本项目将建立基于结构约束的视觉大数据简洁表示理论和方法,突破视觉大数据语义理解在实时性和鲁棒性方面的技术瓶颈,推动我国视觉大数据相关应用和产业发展。通过这个项目, 我们发表了六篇IEEE Transactions论文: 一篇TPAMI,两篇TNNLS,一篇TCYB,一篇TIP,和一篇TII。我们也发表了其他四篇杂志论文。我们也发表了会议论文,比如KDD,AAAI,ICDM,ECAI各一篇。我们还有一些正在审稿的论文,比如我们投了两篇TPAMI和一篇TNNLS等。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
低轨卫星通信信道分配策略
基于细粒度词表示的命名实体识别研究
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
基于生物视觉感知和稀疏表示的非约束人脸识别研究
基于深度学习的带有相似性约束的机器人视觉语义联合表示模型研究
基于稀疏表示的在线视觉跟踪
多源视觉场景下基于深度多特征数据表示的视频事件检测