Deep neural networks have recently achieved great successes in computer vision, natural language processing and speech recognition, resulting in leading advances in artificial intelligence. However, deep neural networks have very high spatial and temporal complexities because of their complicated structure and large number of parameters. Training and running deep neural networks consume long period and need high-end hardware such as GPUs. Therefore compressing deep neural networks to reduce their spatial and temporal complexities while keeping their performance becomes an important research field. This field is at its starting stage and many important problems remain to be solved. This project aims to do comprehensive research around this filed. For some typical deep neural networks, we plan to propose some new compressing methods including hashing and quantization based methods, low rank tensor decomposition based methods, joint learning methods with compression and training, and the ensemble of these methods. We will further investigate the deep neural networks with discrete weights and their learning algorithms. Finally, we will investigate the applications of the compressed deep neural networks, trying to implement the proposed algorithms in smart mobile devices and apply them to object detection, tracking and recognition.
深度神经网络近年来在计算机视觉、自然语言处理和语音识别等领域取得了巨大突破,引领了人工智能的发展。但深度神经网络的结构复杂、参数众多,使其时空复杂性很高,训练和运行深度神经网络需要图形处理器等高端硬件且耗时较多。因此,压缩深度神经网络模型,减少其时空复杂度同时保持其性能成为了当前国内外的重要研究课题。该研究课题目前尚处于起步阶段,有许多重要的问题待解决。本项目围绕深度神经网络压缩及应用展开深入研究。针对一系列主流深度神经网络,提出新的压缩方法。包括基于哈希和量化的压缩方法,基于低秩张量分解的压缩方法,压缩和训练的联合学习方法,并集成多种方法提高压缩性能;进一步研究离散权值深度神经网络及其训练算法;研究压缩深度神经网络框架在智能移动平台上的实现,并通过目标检测、跟踪、识别等应用验证提出的算法。项目的研究成果将解决深度神经网络小型化问题,促进强大的深度学习算法在智能移动设备上的广泛应用。
深度神经网络近年来在计算机视觉等领域取得了巨大成功,但其结构复杂、参数众多,训练和运行需求资源大。本项目围绕深度神经网络压缩及应用展开深入研究。取得的主要研究成果包括:.一、深入研究了轻量级网络设计和网络压缩问题。提出了一种高效的训练感知卷积神经网络压缩框架,在与现有方法相近的性能下,压缩比更高。提出一种基于高效的精简非局部操作的轻量化实时语义分割网络LRNNet,仅有0.68M参数,达到实时推理速度。提出了一种监督方式解耦的轻量化单目深度估计网络,在使用极少参数的情况下达到SOTA的效果。提出一种基于蒸馏策略和级联架构的小而精确的人脸对齐模型,参数仅有3.64M,比主流模型小6倍,精度优于最先进的算法。提出一种基于实例统计感知监督信息的高效轻量级文本检测网络ShallowNet,显着减少了参数量并提高了推理速度。提出一种归纳引导滤波器,实现弱标注移动端实时抠图。.二、研究了深度神经网络结构优化设计问题。提出一种基于LSTM的循环层聚合网络,可提取更具表现力的特征。提出一种二值化网络搜索方法,直接搜索二值网络。提出一种面向目标检测的神经架构自适应实现动态和可扩展的主动学习,优于先前具有固定架构的最先进的主动学习方法。提出用于高效动作识别的协作位置运动激励模块,与最先进的方法相比取得了有竞争力的结果。.三、深入研究了深度学习在多个计算机视觉领域的应用。在行人再识别方面,提出了一种属性驱动的特征解耦和时序融合的视频行人再识别方法等6种方法。在人体行为分析方面,提出了针对骨骼动作识别的一种自适应图卷积网络算法等7种方法。在人脸方面,提出了一种空间梯度引导学习和语义关系转移的人脸关键点检测等3种方法。在场景文字检测方面,提出一种通过联合学习字符和单词区域进行文本检测的方法。在底层视觉问题方面,提出了一种基于纹理Transformer模型的图像超分辨率等方法。在图像描述生成方面,提出了前后向模型、基于召回机制等模型。. 项目研究成果在多个领域有重要理论意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于二维材料的自旋-轨道矩研究进展
压缩深度卷积神经网络及其在目标检测与图像取证中的应用研究
基于压缩学习的深度神经网络专用处理芯片研究
基于深度神经网络的动态多模态数据特征提取及其应用研究
基于深度神经网络的哈希学习及其在图像检索中的应用研究