推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

深度学习在目标视觉检测中的应用进展与展望

更新时间:2019-12-24 00:09:03 大小:1M 上传用户:zhiyao6查看TA发布的资源 标签:深度学习 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

目标视觉检测是计算机视觉领域的一个重要问题,在视频监控、自主驾驶、人机交互等方面具有重要的研究意义和应用价值.近年来,深度学习在图像分类研究中取得了突破性进展,也带动着目标视觉检测取得突飞猛进的发展.本文综述了深度学习在目标视觉检测中的应用进展与展望.首先对目标视觉检测的基本流程进行总结,并介绍了目标视觉检测研究常用的公共数据集;然后重点介绍了目前发展迅猛的深度学习方法在目标视觉检测中的最新应用进展;最后讨论了深度学习方法应用于目标视觉检测时存在的困难和挑战,并对今后的发展趋势进行展望.


部分文件列表

文件名 大小
深度学习在目标视觉检测中的应用进展与展望.pdf 1M

部分页面预览

(完整内容请下载后查看)
43 卷 第 8 期  
2017 8 月  
Vol. 43, No. 8  
August, 2017  
ACTA AUTOMATICA SINICA  
深度学习在目标视觉检测中的应用进展与展望  
张 慧 1  
2
3
4
王坤峰 1  
王飞跃 1  
目标视觉检测是计算机视觉领域的一个重要问题, 在视频监控主驾驶机交互等方面具有重要的研究意义和应  
用价值. 近年来, 深度学习在图像分类研究中取得了突破性进展, 也带动着目标视觉检测取得突飞猛进的发展. 本文综述了深  
度学习在目标视觉检测中的应用进展与展望. 首先对目标视觉检测的基本流程进行总结, 并介绍了目标视觉检测研究常用的  
公共数据集; 然后重点介绍了目前发展迅猛的深度学习方法在目标视觉检测中的最新应用进展; 最后讨论了深度学习方法应  
用于目标视觉检测时存在的困难和挑战, 并对今后的发展趋势进行展望.  
关键词 目标视觉检测, 深度学习, 计算机视觉, 平行视觉  
引用格式 张慧, 王坤峰, 王飞跃. 深度学习在目标视觉检测中的应用进展与展望. 自动化学报, 2017, 43(8): 12891305  
DOI 10.16383/j.aas.2017.c160822  
Advances and Perspectives on Applications of Deep Learning in  
Visual Object Detection  
2
3
4
ZHANG Hui1  
WANG Kun-Feng1  
WANG Fei-Yue1  
Abstract Visual object detection is an important topic in computer vision, and has great theoretical and practical  
merits in applications such as visual surveillance, autonomous driving, and human-machine interaction. In recent years,  
significant breakthroughs of deep learning methods in image recognition research have arisen much attention of researchers  
and accordingly led to the rapid development of visual object detection. In this paper, we review the current advances  
and perspectives on the applications of deep learning in visual object detection. Firstly, we present the basic procedure for  
visual object detection and introduce some newly emerging and commonly used data sets. Then we detail the applications  
of deep learning techniques in visual object detection. Finally, we make in-depth discussions about the difficulties and  
challenges brought by deep learning as applied to visual object detection, and propose some perspectives on future trends.  
Key words Visual object detection, deep learning, computer vision, parallel vision  
Citation Zhang Hui, Wang Kun-Feng, Wang Fei-Yue. Advances and perspectives on applications of deep learning in  
visual object detection. Acta Automatica Sinica, 2017, 43(8): 12891305  
目标视觉检测是计算机视觉领域中一个非常重  
要的研究问题 随着电子设备的应用在社会生产和  
人们生活中越来越普遍 数字图像已经成为不可缺  
少的信息媒介 每时每刻都在产生海量的图像数据  
与此同时 对图像中的目标进行精确识别变得越来  
越重要[1] 我们不仅关注对图像的简单分类 而且  
希望能够准确获得图像中存在的感兴趣目标及其位  
[2] 并将这些信息应用到视频监控主驾驶等一  
系列现实任务中 因此目标视觉检测技术受到了广  
泛关注[3]  
收稿日期 2016-12-15 录用日期 2017-03-16  
Manuscript received December 15, 2016; accepted March 16,  
2017  
国家自然科学基金 (61533019, 61304200), 国家留学基金 (20150491  
0397) 资助  
Supported by National Natural Science Foundation of China  
目标视觉检测具有巨大的实用价值和应用前景  
应用领域包括智能视频监控器人导航码相  
机中自动定位和聚焦人脸的技术机航拍或卫星  
图像中道路的检测载摄像机图像中的障碍物检  
测等 同时 目标视觉检测也是众多高层视觉处理和  
分析任务的重要前提 例如行为分析件检测场  
景语义理解等都要求利用图像处理和模式识别技术  
检测出图像中存在的目标 确定这些目标对象的语  
义类型 并且标出目标对象在图像中的具体区域[4]  
在自然环境条件下 目标视觉检测经常遇到以  
下几个方面的挑战  
(61533019, 61304200) and China Scholarship Council (20150491  
0397)  
本文责任编委 周涛  
Recommended by Associate Editor ZHOU Tao  
1. 中国科学院自动化研究所复杂系统管理与控制国家重点实验室 北京  
100190 2. 中国科学院大学 北京 100049 3. 青岛智能产业技术研  
究院 青岛 266000 4. 国防科学技术大学军事计算实验与平行系统技  
术研究中心 长沙 410073  
1. State Key Laboratory of Management and Control for Com-  
plex Systems, Institute of Automation, Chinese Academy of Sci-  
2. University of Chinese Academy of  
3. Qingdao Academy of Intelligent  
ences, Beijing 100190  
Sciences, Beijing 100049  
Industries, Qingdao 266000 4. Research Center for Computa-  
tional Experiments and Parallel Systems Technology, National  
University of Defense Technology, Changsha 410073  
1290  
43 卷  
类内和类间差异  
对于很多物体 它们自身就存在很大的差异性  
选区域分类等步骤采用了不同的处理策略 近年来  
随着深度学习技术的发展 很多基于深度学习的目  
标视觉检测方法陆续被提出 在精度上显著优于传  
统方法 成为最新的研究热点 本文首先介绍目标视  
觉检测的基本流程 然后重点介绍深度学习在目标  
视觉检测中的应用进展  
同类物体的不同实例在颜色状等方面可  
能存在巨大的差异 很难训练一个能够包含所有类  
内变化的特征描述模型 另外 不同类型物体之间又  
可能具有很大的相似性 甚至非专业人员从外观上  
很难区分它们 类内差异可能很大 而类间差异可能  
很小 给目标视觉检测提出了挑战  
本文内容安排如下 第 节介绍目标视觉检测  
的基本流程 第 节对目标视觉检测研究常用的公  
共数据集进行概述 第 节介绍深度学习技术在目  
标视觉检测中的最新应用进展 第 节讨论深度学  
习技术应用于目标视觉检测时存在的困难和挑战  
并对今后的发展趋势进行展望 第 节对本文进行  
总结  
图像采集条件  
在图像采集过程中 由于环境拍  
摄视角和距离的不同体自身的非刚体形变以及  
可能被其他物体部分遮挡 导致物体在图像中的表  
观特征具有很大的多样性 对视觉算法的鲁棒性提  
出了很高要求  
语义理解的差异  
1 目标视觉检测的基本流程  
对同一幅图像 不同的人可能会有不同的理解  
这不仅与个人的观察视角和关注点有关 也与个人  
的性格理状态和知识背景等有关 这明显增加了  
从仿生或类脑角度来研究视觉算法的难度  
计算复杂性和自适应性  
目标视觉检测的根本问题是估计特定类型目标  
出现在图像中的哪些位置 如图 所示 目标视觉检  
测技术在流程上大致分为三个步骤 区域建议  
征表示  
目标视觉检测的计算复杂性主要来自于待检测  
目标类型的数量征描述子的维度和大规模标记  
数据集的获取 由于在真实世界中存在大量的目标  
类型 每种类型都包含大量的图像 同时识别每种类  
型需要很多视觉特征 这导致高维空间稀疏的特征  
描述[4] 另外 目标模型经常从大规模标记数据集中  
学习得到 在许多情况下 数据采集和标注很困难  
需要耗费大量的人力物力 这些情况导致目标检测  
的计算复杂性很高 需要设计高效的目标检测算法  
同时 在动态变化的环境中 为了提高目标检测精  
度 还需要探索合适的机制来自动更新视觉模型 提  
高模型对复杂环境的自适应能力  
和区域分类  
首先对图像中  
可能的目标位置提出建议 也就是提出一些可能含  
有目标的候选区域 然后采用合适的特征模型得到  
特征表示 最后借助分类器判断各个区域中是否含  
有特定类型的目标 并且通过一些后处理操作 例  
如非极大值抑制框位置回归等 得到最终的目  
标边框 该基本流程被许多工作所采用 例如文献  
提出的  
检测方法献  
提出的  
区域建议方法前在  
等数据集上取得领  
[7]  
先精度的  
检测方法以及  
[8]  
采用的特征表示和区域分类方法  
为了克服上述挑战 已经提出了许多目标视觉  
检测算法 它们在目标区域建议像特征表示候  
本节接下来从区域建议征表示和区域分类  
1 目标视觉检测的基本流程  
Fig. 1 Basic procedure for object detection  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载