您现在的位置是:首页 > 技术资料 > 视频行为识别综述
推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

视频行为识别综述

更新时间:2019-12-30 14:21:10 大小:968K 上传用户:IC老兵查看TA发布的资源 标签:行为识别深度网络数据集 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

目前行为识别发展迅速,许多基于深度网络自动学习特征的行为识别算法被提出。深度学习方法需要大量数据来训练,对电脑存储、运算能力要求较高。在回顾了当下流行的基于深度网络的行为识别方法的基础上,着重综述了基于手动提取特征的传统行为识别方法。传统行为识别方法通常遵循对视频提取特征并进行建模和预测分类的流程,并将识别流程细分为以下几个步骤进行综述:特征采样、特征描述符选取、特征预/后处理、描述符聚类、向量编码。同时,还对评价算法性能的基准数据集进行了归纳总结。


部分文件列表

文件名 大小
1577686865视频行为识别综述.pdf 968K

部分页面预览

(完整内容请下载后查看)
39 卷第 6 期  
2018 6 月  
Vol.39 No.6  
June 2018  
Journal on Communications  
视频行为识别综述  
罗会兰,王婵娟,卢飞  
(江西理工大学信息工程学院,江西 赣州 341000)  
摘 要:目前行为识别发展迅速,许多基于深度网络自动学习特征的行为识别算法被提出。深度学习方法需要大  
量数据来训练,对电脑存储、运算能力要求较高。在回顾了当下流行的基于深度网络的行为识别方法的基础上,  
着重综述了基于手动提取特征的传统行为识别方法统行为识别方法通常遵循对视频提取特征并进行建模和预  
测分类的流程,并将识别流程细分为以下几个步骤进行综述:特征采样、特征描述符选取、特征预/后处理、描述  
符聚类、向量编码。同时,还对评价算法性能的基准数据集进行了归纳总结。  
关键词:行为识别;手动提取;深度网络;数据集  
中图分类号:TP391  
文献标识码:A  
doi: 10.11959/j.issn.1000-436x.2018107  
Survey of video behavior recognition  
LUO Huilan, WANG Chanjuan, LU Fei  
School of Information Engineering, Jiangxi University of Science and Technology, Ganzhou 341000, China  
Abstract: Behavior recognition is developing rapidly, and a number of behavior recognition algorithms based on deep  
network automatic learning features have been proposed. The deep learning method requires a large number of data to  
train, and requires higher computer storage and computing power. After a brief review of the current popular behavior  
recognition method based on deep network, it focused on the traditional behavior recognition methods. Traditional be-  
havior recognition methods usually followed the processes of video feature extraction, modeling of features and classifi-  
cation. Following the basic process, the recognition process was overviewed according to the following steps, feature  
sampling, feature descriptors, feature processing, descriptor aggregation and vector coding. At the same time, the bench-  
mark data set commonly used for evaluating the algorithm performance was also summarized.  
Key words: behavior recognition, handcrafted, deep network, data set  
么地方做了什么事情体行为识别在安防、  
1 引言  
交通管理、智能看护、娱乐休闲等现实生活中应用  
广泛。目前,行为识别的研究方法主要有 2 种:一  
种是基于手动提取特征的方法,另一种是基于深度  
网络学习特征的方法。2 种方法各有长短,基于手  
动提取特征的方法能够根据需要提取相应的特征,  
实现简单,但行为的表示能力也受所提取特征的限  
制;基于深度网络学习特征的方法能够自动学习特  
需要大量数据支撑适于小型数据集处理,  
人体行为识别是指利用模式识别、机器学习等  
方法,从一段未知的视频中自动分析识别人体执行  
的行为。最简单的行为识别也称为行为分类,它可  
以将未知视频中的人体行为分类到预先定义的几  
种行为类别中。较为复杂的行为识别是指识别视频  
中多个人体正在交互进行的群体活动。行为识别的  
最终目标是自动分析视频中有什么人,在什么时  
收稿日期2018-01-29修回日期2018-05-16  
基金项目国家自然科学基金资助项No.61105042, No.61462035西省自然科学基金资助项No.20171BAB202014)  
Foundation Items: The National Natural Science Foundation of China (No.61105042, No.61462035), The Natural Science Founda-  
tion of Jiangxi Province (No.20171BAB202014)  
2018107-1  
·170·  
39 卷  
且整个过程是端到端的,像个黑盒子,不适于计算  
视觉领域的研究初学者熟悉图像、视频处理的基本  
技术和基本步骤。  
特征表示的行为识别方法,按照流程就每个相对  
独立的步骤进行了总结归纳,然后在此基础上综  
述了当前流行的用于行为识别的深度学习模型。  
主要贡献如下。  
Moeslund [1]按照行为的复杂程度将人体行为  
分为 3 个层级:基本动作、行为和活动。基本动  
作指的是能在肢体层次上描述的基本运动;行为  
指的是由基本动作构成,描述一个可能是周期性  
的全身运动;活动包含许多后续动作,并对正在  
执行的动作进行解释。例如,左腿向前是一个基  
本动作,跑步是一个行为,跨栏就是一个包括开  
始、跳跃和跑步动作的一个活动。与此类似,文  
[2]认为行为识别可以分为 2 类:一类是低层动  
作的识别,另一类是高层行为的识别,其还认为  
前者是后者的基础,并依此将行为识别方法分为  
2 类进行综述。  
Ji [3]按行为识别的步骤将其分成 3 个子问题:  
人体检测、与视觉无关的姿势表示和估计、行为理  
解,并对其进行了综述。而 Dhamsania [4]按照视  
频场景中的目标人物数对识别方法进行了分类,将  
其区分为单人行为识别、双人或人与物互动的行为  
识别以及多人行为识别。Candamo [5]则讨论了交  
通监管视频场景中的行为识别问题:单人游荡识  
人打架识别以及人与物体互动识如偷车、  
毁坏公共设施等Poppe [6]将视频行为识别的问  
题转化为图像序列的识别分类问题,并讨论了图像  
的各种表示及分类方法。  
1) 对基于手动提取特征表示的行为识别方法  
进行了较为系统、全面的研究和分类,并对每类方  
法中的典型算法进行了阐述和分析。  
2) 2012 年以来以卷积神经网络为代表的深  
度网络学习技术在行为识别中的应用进行了研究  
和阐述。  
3) 对行为识别算法常用的基准数据集法性  
能评价指标进行了研究和介绍。  
4) 讨论了行为识别中目前存在的待解决的  
主要问题以及未来发展的趋势。  
2 基于手动特征的行为识别方法  
基于手动提取特征的行为识别方法一般包含  
如图 1 所示的处理流程,即首先对视频进行采样,  
然后对样本提取特征,接着对特征进行编码,再对  
编码得到的向量进行规范化,最后训练分类。  
2.1 特征采样方法  
一般而言,提取特征之前需要先对视频进行兴  
趣点采样,然后对采样兴趣点进行特征信息的提  
取。采样方式有基于兴趣区域的采样、基于轨迹的  
采样和基于身体部分的采样等。  
2.1.1 基于兴趣区域的采样  
有些综述着眼于讨论某一特定动作类识别问  
题。Weinland [7]着眼于解决全身运动(如踢打、  
拳击等)识别问题的方法,并对这些方法按照如何  
表示动作的时空结构、如何对视频进行分割以及如  
何学习获得行为表示进行分类Chaudhary [8]着眼  
于解决手势识别问题的方法,比较分析了当前一些  
流行方法的实验结果。  
基于兴趣区域的采样方法是指利用探测器检  
测视频的兴趣区域,从而提取特征描述的方法。这  
类方法不需要对行为视频进行前景背景分割,也不  
需要对发生行为的人体进行精确的定位跟踪。  
Laptev [9]提出对 Harris 角点检测方法[10]进行时空  
扩展,在行为视频中进行 Harris3D 兴趣点检测。  
Harris3D 检测空间维与时间维上都具有显著变化的  
点区域,并自适应地选择兴趣点的时间尺度与空间  
尺度。图 2 示例了对 UCF101[11]数据库中画眼妆这  
个动作的兴趣点采样截图。Oikonomopoulos [12]  
提出了一种基于时空显著点的行为表征方法:首先  
为了让初学者更好地理解传统视频行为识别  
方法的基本流程及其与最新深度网络模型方法的  
区别,本文分别综述了传统手动提取特征方法和  
深度网络学习方法,并重点论述了基于手动提取  
1 基于手动提取特征的行为识别流程  
2018107-2  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载