Small object detection is of significant value in many military and civil applications. However, it remains to be a highly challenging problem. Constructing effective deep learning model and computation methodology is an important way to obtain better detection capability for small objects. Since it is hard to extract obvious differential features from small objects, and they are prone to the disturbance of noise, small object detection often suffers from high false positive and false negative rate. Thus, we propose a short connection feedback deep neural network (DNN) model, as well as its training method. Then, with careful analysis of open-source deep learning frameworks such as TensorFlow and Caffe, we propose improved parallelization training schemes for DNN model with multi-tasking on stream processors, targeting at NUMA architecture on CPU-GPU heterogeneous system. Besides, for embedded platforms such as Cambricon processors and FPGA, we investigate the compression method of DNN model and acceleration techniques for inference on embedded devices. Finally, we choose medical graphs of eye ground as the objects to build an intelligent system by incorporating edge computing and cloud computing, and make it a model for the realization of medicine with artificial intelligence. This project would have profound impact on promoting the application of small object detection in the fields of artificial intelligence, as well as the development of heterogeneous computing.
小物体检测在军事和民用领域具有重要应用价值,但目前仍然是一个富有挑战性的问题。构建有效的深度学习模型及其计算方法是提高小物体检测能力的重要途径,本项目首先针对小物体特征区分度低、易受噪声干扰而导致的高误报率问题,提出一种短连接反馈式的深度神经网络模型(DNN)及其训练方法。其次,剖析TensorFlow和Caffe等开源深度学习框架,面向异构NUMA结构下的GPU加速器设计基于流处理器多任务模式的DNN模型并行计算方法,提升DNN模型的训练效率。再次,针对寒武纪和FPGA等嵌入式平台特征,研究DNN模型的压缩方法及其硬件加速技术,提升DNN模型的推理效率。最后,以眼底图像处理为应用对象,构建融合云计算和边缘计算技术的眼底图像智能分析系统,实现人工智能医学应用示范。该项目对于推动小物体检测在人工智能领域的应用以及异构计算技术发展具有重要意义。
小物体检测在民用和军事等多个领域均有广泛应用,例如医学图像、遥感图像、视频图像等。但在实际应用中,仍会遇到由于目标特征不明显、目标尺寸不均一以及易与噪音混淆导致检测精度不理想的问题。本项目从提高小物体检测的精度和计算效率两个角度出发,以医学图像处理和视频图像处理这种典型应用为研究对象,融合云计算和边缘计算技术,设计了基于深度学习的深度神经网络模型及其训练算法,使其能够很好地适应医学图像、行人检测以及人脸检测等小目标数据,并通过量化方法实现深度神经网络模型的压缩,便于模型在智能处理器以及FPGA等平台的部署应用。取得的主要成果如下:1)构建OIA-DDR和OIA-ODIR两个数据集,丰富了我国大规模眼底图像数据集,特别是在单张图像多病变标注方面填补了国内空白,进一步促进了本领域研究的交流和发展;2)设计多种高效的深度神经网络模型,实现了对眼底图像的血管、病变分割和分类任务;3)提出一种有效的小人脸检测网络,解决了多尺度小人脸检测过程中信息丢失带来的影响;4)构建行人重识别数据集NKUP和NKUP+,设计用于行人重识别的深度学习网络,利用姿态注意力机制提取姿态特征信息,并与全局特征进行融合,显著提高了跨域行人重识别的性能;5)提出一种基于弹性有效位的FPGA加速器设计和实现方案,与定点数格式的加速器相比,在相同的量化位宽和计算性能条件下,其逻辑资源消耗可降低12.9%;6)将上述部分眼底图像深度学习模型部署至云服务中并设计眼科云筛查平台,实现了多台计算机共同联动计算,提高了数据整合和处理速度。为支持国产化信创生态建设,在华为Atlas 200智能处理器上进行了血管分割深度神经网络模型部署和优化,并形成《昇腾AI处理器CANN应用与实战—基于Atlas硬件的人工智能案例开发指南》的第六章。综上所述,本项目的研究和实施为小物体检测在实际应用的转化过程中提供了重要的研究和参考价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
硬件木马:关键问题研究进展及新动向
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于全模式全聚焦方法的裂纹超声成像定量检测
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
基于深度学习的视觉显著物体检测与跟踪
基于深度学习的复杂图像显著物体检测方法研究
基于图像集合和深度学习的物体分类关键技术研究
基于图像属性和深度学习的大规模物体检测研究与应用