推荐星级：

构建多尺度深度卷积神经网络行为识别模型

更新时间：2019-12-30 03:34:07 大小：2M 上传用户：zhiyao6 查看TA发布的资源 标签：深度卷积神经网络 下载积分：1分评价赚积分（如何评价?）打赏收藏评论(0) 举报

资料介绍

为了减化传统人体行为识别方法中的特征提取过程,提高所提取特征的泛化性能,本文提出了一种基于深度卷积神经网络和多尺度信息的人体行为识别方法。该方法以深度视频为研究对象,通过构建基于卷积神经网络的深度结构,并融合粗粒度的全局行为模式与细粒度的局部手部动作等多尺度信息来研究人体行为的识别。MSRDailyActivity3D数据集上的实验得出该数据集上第11~16种行为的平均识别准确率为98%,所有行为的平均识别准确率为60.625%。结果表明,本方法能对人体行为进行有效识别,基本能准确识别运动较为明显的人体行为,对仅有手部局部运动的行为的识别准确率有所下降。

部分文件列表

文件名	大小
构建多尺度深度卷积神经网络行为识别模型.pdf	2M

立即下载

【关注B站账户领20积分】

部分页面预览

（完整内容请下载后查看）

第

卷

第

期

３

光学精密工程

ꢀ

２５

ꢀ

Ｖｏｌ．２５Ｎｏ．３

ꢀ

ꢀꢀꢀꢀꢀ ꢀꢀꢀꢀ

ꢀ ꢀꢀ ꢀꢀꢀ

ＯｔｉｃｓａｎｄＰｒｅｃｉｓｉｏｎＥｎｉｎｅｅｒｉｎ

ꢀ ｐ ꢀ ꢀ ꢀ ｇ

ｇ

年

月

ꢀ ꢀ

２０１７

３

Ｍａｒ．２０１７

ꢀ ꢀ

（）

１００４９２４Ｘ２０１７０３０７９９０７

－

文章编号

ꢀ

－

构建多尺度深度卷积神经网络行为识别模型

１

２

＊

黄江涛

１

，

冯

刘

智

欣

ꢀ

（，

重庆理工大学计算机学院重庆

１．

；

４０００５４

，

广西师范学院计算机与信息工程学院广西南宁

２．

）

５３０００１

：，，

摘要为了减化传统人体行为识别方法中的特征提取过程提高所提取特征的泛化性能本文提出了一种基于深度卷积

。，

神经网络和多尺度信息的人体行为识别方法该方法以深度视频为研究对象通过构建基于卷积神经网络的深度结构

，

。

并融合粗粒度的全局行为模式与细粒度的局部手部动作等多尺度信息来研究人体行为的识别

数

ＭＳＲＤａｉｌＡｃｔｉｖｉｔ３Ｄ

ｙｙ

，

所有行为的平均识别准确率为

６０．６２５％

。

据集上的实验得出该数据集上第

种行为的平均识别准确率为

１１１６

～

９８％

，，，

结果表明本方法能对人体行为进行有效识别基本能准确识别运动较为明显的人体行为对仅有手部局部运动的行为

。

的识别准确率有所下降

：；；；；

词卷积神经网络深度学习人体行为识别计算机视觉多尺度

ꢀ

关

键

ꢀ

：；

ＴＰ３９４．１ＴＨ６９１．９

ꢀꢀ

：

文献标识码

Ａ

：

／

中图分类号

ｄｏｉ１０．３７８８ＯＰＥ．２０１７２５０３．０７９９

ꢀꢀ

Ａｃｔｉｏｎｒｅｃｏｎｉｔｉｏｎｍｏｄｅｌｃｏｎｓｔｒｕｃｔｉｏｎｂａｓｅｄ

ꢀ ꢀ ꢀ ꢀ

ｇ

ｏｎｍｕｌｔｉｓｃａｌｅｄｅｅｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋ

ꢀ

－ ꢀ ꢀ ꢀ

ｐ

ꢀ

１

，

ＬＩＵＺｈｉＨＵＡＮＧＪｉａｎｔａｏ

２

１

＊

，

ＦＥＮＧＸｉｎ

ꢀ

ꢀ ꢀ

ꢀ

ｇ

－

（

，

１．ＣｏｌｌｅｅｏＣｏｍｕｔｅｒＳｃｉｅｎｃｅａｎｄＥｎｉｎｅｅｒｉｎ

ꢀ

ｇ

ꢀ

ｇｆ

ꢀ

ｇ

ｐ

ꢀ

，

；

Ｃｈｏｎｉｎ４０００５４Ｃｈｉｎａ

ｇｑｇ

ＣｈｏｎｉｎＵｎｉｖｅｒｓｉｔｏＴｅｃｈｎｏｌｏ

ｇｑｇｙｆｇｙ

ꢀ ꢀ

ꢀ

，

２．ＣｏｌｌｅｅｏＣｏｍｕｔｅｒａｎｄＩｎｏｒｍａｔｉｏｎＥｎｉｎｅｅｒｉｎ

ꢀ

ｇ

ꢀ

ｇｆ

ꢀ

ｇ

ｐ

ｆ

ꢀ

，，

ＧｕａｎｘｉＴｅａｃｈｅｒｓＥｄｕｃａｔｉｏｎＵｎｉｖｅｒｓｉｔＮａｎｎｉｎ５３０００１Ｃｈｉｎａ

ꢀ

）

ꢀ

ｇ

ｙ

ｇ

，

ＣｏｒｒｅｓｏｎｄｉｎａｕｔｈｏｒＥｍａｉｌｈｔｘｔｃ．ｅｄｕ．ｃｎ

－

：

＠

ｊｇ

＊

ｐ

ｇ

ꢀ

：（

ＡｂｓｔｒａｃｔＩｎｏｒｄｅｒｔｏｓｉｍｌｉｆｔｈｅｆｅａｔｕｒｅｅｘｔｒａｃｔｉｎｒｏｃｅｓｓｏｆＨｕｍａｎＡｃｔｉｖｉｔＲｅｃｏｎｉｔｉｏｎＨＡＲ

ꢀ

）

ꢀ

ꢀ ꢀ ｐｙ

ꢀ

ｇｐ

ꢀ

ꢀ ꢀ

ꢀ

ｙ

ꢀ

ｇ

ꢀ

，

ａｎｄｉｍｒｏｖｅｔｈｅｅｎｅｒａｌｉｚａｔｉｏｎｏｆｅｘｔｒａｃｔｅｄｆｅａｔｕｒｅａｎａｌｏｒｉｔｈｍｂａｓｅｄｏｎｍｕｌｔｉｓｃａｌｅｄｅｅ

ꢀｇ ꢀ ꢀ ꢀ ｇ

ｐ

ꢀ

ｐ

ꢀ

－

ꢀ

，

ｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋｗａｓｒｏｏｓｅｄ．Ｉｎｔｈｉｓａｌｏｒｉｔｈｍｔｈｅｄｅｔｈｖｉｄｅｏｗａｓｓｅｌｅｃｔｅｄａｓｒｅｓｅａｒｃｈ

ꢀｐｐ ꢀ ｇ ꢀ ｐ ꢀ ꢀ ꢀ

ꢀ

ꢀ ꢀ

（

）

ｏｂｅｃｔａｎｄａａｒａｌｌｅｌＣＮＮＣｏｎｖｏｌｕｔｉｏｎＮｅｕｒａｌＮｅｔｗｏｒｋｂａｓｅｄｄｅｅｎｅｔｗｏｒｋｗａｓｃｏｎｓｔｒｕｃｔｅｄｔｏ

ｊ ꢀ ꢀꢀｐ

ꢀ

ｐ

ꢀ

ｒｏｃｅｓｓｃｏａｒｓｅｌｏｂａｌｉｎｆｏｒｍａｔｉｏｎｏｆｔｈｅａｃｔｉｏｎａｎｄｆｉｎｅｒａｉｎｅｄｌｏｃａｌｉｎｆｏｒｍａｔｉｏｎｏｆｈａｎｄａｒｔ

ꢀｇ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀｐ

ｐ

ꢀ

－

ｇ

ꢀ

ｓｉｍｕｌｔａｎｅｏｕｓｌ．ＥｘｅｒｉｍｅｎｔｓｗｅｒｅｅｘｅｃｕｔｅｄｏｎＭＳＲＤａｉｌＡｃｔｉｖｉｔ３Ｄｄａｔａｓｅｔ．Ｔｈｅａｖｅｒａｅｒｅｃｏｎｉｔｉｏｎ

ꢀ ꢀ ꢀ ꢀ ꢀ

ｙｙｇꢀ

ｙ

ｐ

ｇ

，

ａｃｃｕｒａｃｏｎａｃｔｉｏｎｓｒａｎｉｎｆｒｏｍＮｏ．１１ｔｏＮｏ．１６ｗａｓ９８％ｗｈｉｌｅｔｈａｔｏｎａｌｌａｃｔｉｏｎｓｗａｓ６０．６２５％．

ｇｇ

ꢀ ꢀ ꢀ

ｙ

ꢀ

ꢀ ꢀ

ꢀ

Ｔｈｅｅｘｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｅｄｔｈａｔｒｏｏｓｅｄａｌｏｒｉｔｈｍｃｏｕｌｄｔａｋｅｅｆｆｅｃｔｉｖｅｒｅｃｏｎｉｔｉｏｎｆｏｒｈｕｍａｎ

ꢀ ｐ ꢀ ꢀｐｐ ꢀ ｇ ꢀ ꢀ ꢀ ꢀ

ꢀ

ｇ

ꢀ ꢀ

ａｃｔｉｖｉｔ．Ａｌｍｏｓｔａｌｌｏｆｔｈｅａｃｔｉｏｎｓｗｉｔｈｏｂｖｉｏｕｓｍｏｖｅｍｅｎｔｓａｎｄｍｏｓｔｏｆａｃｔｉｏｎｓｗｉｔｈｌｏｃａｌｍｏｖｅｍｅｎｔｓ

ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ

ｙ

ꢀ ꢀ ꢀ

ꢀ

：

；

：

修订日期

２０１７０１１５．

收稿日期

２０１６１２２１

－－

ꢀꢀ

－

：

基金项目重庆市教委科学技术研究基金资助项目

（

）；（

广西自然科学基金重点项目

Ｎｏ．

Ｎｏ．ＫＪ１４００９２６

ꢀꢀ

）

２０１４ＧＸＮＳＦＤＡ１１８０３７

光学精密工程

ꢀ

第

卷

ꢀ

２５

８００

ꢀꢀꢀꢀꢀ

ｕｓｔｉｎｈａｎｄｓｃｏｕｌｄｂｅｒｅｃｏｎｉｚｅｄｅｆｆｅｃｔｉｖｅｌ．

ꢀ ꢀ ꢀ ꢀ

ｊ ꢀ ꢀ ｇｙ

：；；；

Ｋｅｗｏｒｄｓｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋｄｅｅｌｅａｒｎｉｎｈｕｍａｎａｃｔｉｖｉｔｒｅｃｏｎｉｔｉｏｎｃｏｍｕｔｅｒｖｉｓｉｏｎ

ꢀ

；

ꢀ

ｐ

ꢀ

ｇ

ｙ

ꢀ

ｇ

ｐ

ꢀ

ｙ

ꢀ

ｍｕｌｔｉｓｃａｌｅ

－

；，

泛化到其他数据计算开销太大很难做到实时

。

性

深度学习能自动提取隐藏在数据间的多层特

引言

１

ꢀ ꢀ

，，

征表示已经成功应用于语音识别图像识别与分

，

目前有关人体行为识别的研究越来越引起

，。

类分割等领域鉴于深度学习的上述优点

，

［］

１０

，

计算机视觉研究工作者的重视并已广泛应用于

等人

运用独立子空间分析

ＱｕｏｃＶ．Ｌｅ

ꢀ

，，，

自动监控事件检测人机接口视频获取等各个

（

，

）

算法自动

ＩｎｄｅｅｎｄｅｎｔＳｕｂｓａｃｅＡｎａｌｓｉｓＩＳＡ

ｐ

ꢀ

ｐ

ꢀ

ｙ

。

领域传统的人体行为识别方法主要基于人工设

，

学习视频数据中稳定的时空特征然后使用深度

，

计特征如方向梯度直方图

（

。［］

的多层表示文献利用

１１

结构学习

Ｈｉｓｔｏｒａｍｓｏｆ

ｇ

ꢀ

ＩＳＡ

ＣＮＮ

［］

１

），

运动历史图像

，

ＯｒｉｅｎｔｅｄＧｒａｄｉｅｎｔＨＯＧ

ꢀ

，

构造多层深度结构提出了

，

算法用于

ＰＡＮＤＡ

［］

２

（

，

ＭｏｔｉｏｎＨｉｓｔｏｒＩｍａｅＭＨＩ

ｇ

）

，

等然后采用支

（、、

识别人的属性如性别发型表情等

）。

ꢀ

ｙ

ꢀ

［］

３

持向量机等分类器对提取的特征进行分类识

［］

１２

方法也是基于

构建深度神经网

ＤｅｅＰｏｓｅ

ｐ

ＣＮＮ

［］

４

。

，，

络该方法不但用于图像中人体姿势的识别也对

别

等人通过提取视频中有代表性

ＷａｎｉｎＬｉ

ｑｇ

（

，

）

来表示人体

Ｂａｏｆ３ＤＰｏｉｎｔｓＢＯＰｓ

ｇ ꢀ

。［］

图像中的目标定位进行了探索文献则基于

１３

的

词袋

３Ｄ

ꢀ

，

的一系列姿势然后以

，，

限制波尔茨曼机构造出自举深度信念网络用于

为点构建人体行为

ＢＯＰｓ

［

］

１４

等人在其最新的研

，

图通过计算行为图上每一条路径的概率进行人

。

ＫａｉｍｉｎＨｅ

ｇ

ꢀ

人脸的识别

。

体行为识别文献

［］

研究了运动背景下的行为

２

，

的深度神经网络其

究中同样使用了基于

ＣＮＮ

，

识别首先提取人体的

，

特征然后用

，

贡献在于使用空间池化技术对输入进行处理从

ＭＨＩ

ＨＯＧ

，

进行特征描述最后使用高斯混合模型

（

，

而使得该算法能对任何大小的图像进行分类而

Ｇａｕｓｓｉａｎ

，

ＭｉｘｔｕｒｅＭｏｄｅｌＧＭＭ

ꢀ

）

。

进行行为的分类识别

传统基于的深度学习方法需要将输入规范

ＣＮＮ

［］

５

等人则利用深度视频中的骨架信

ｇ

。

化到统一尺寸为了提高深度学习算法的泛化性

ＪｉａｎＷａｎ

ｇ

ꢀ

［］

１５

，

息通过逐帧计算每个关节相对其他关节的位置

，

等人提出了网络嵌套的思想即网

ＭｉｎＬｉｎ

能

ꢀ

（

。

络中的某一个节点可以嵌套一个网络进行学习

和每个关节的局部占位模式

ＬｏｃａｌＯｃｃｕａｎｃ

ꢀ

ｐｙ

，），

提出了

ＰａｔｔｅｒｎｓＬＯＰ

［］

不但深刻剖析了基于

１６

组合模型来描

文献

的深度神经

ａｃｔｉｏｎｌｅｔ

ＣＮＮ

［］

６

［］

１５

等人的思

。

，

网络的思想而且还借鉴了

ＭｉｎＬｉｎ

述人体行为

和

ＬｕＸｉａＪ．Ｋ．Ａａｒｗａｌ

ｇｇ

先抽取

ꢀ

（

，，

想提出了一个更深层次的网络取得了较好的

深度视频的时空兴趣点

ＳａｔｉｏＴｅｍｏｒａｌ

－

ｐｐ

，），

然后以各

ＩｎｔｅｒｅｓｔＰｏｉｎｔｓＳＴＩＰｓ

ꢀ

，

。

效果

为中心

ＳＴＩＰ

，，

综上基于特征提取的算法时间开销太大难

构造出表示人体行为的深度立方相似特征

（

，

ＤｅｔｈＣｕｂｏｉｄＳｉｍｉｌａｒｉｔＦｅａｔｕｒｅＤＣＳＦ

ｐ ꢀ

）。

。，

以实现实时处理近些年来基于

受

的深度

ＣＮＮ

ꢀ

ｙ

ꢀ

，

神经网络在人工智能领域的应用较为广泛然而

思想的启发

和

Ｚｉｃｈｅｎ

ｇ

ＨＯＧ

ＯｍａｒＯｒｅｉｆｅ

ꢀ

ｊ

［］

７

、、

关于它的研究主要集中在图像识别分割定位等

针对深度视频设计了方向四维法线直方图

Ｌｉｕ

（

，

ＨｉｓｔｏｒａｍｏｆＯｒｉｅｎｔｅｄ４ＤＮｏｒｍａｌｓＨＯＮ４Ｄ

ꢀ

）

，

方面对基于视频的人体行为识别的研究仍比较

ｇ

ꢀ ꢀ

。

特征为了同时强调人体轮廓和运动的作用

，

。

，

视频深度视频能提供

ＲＧＢ

少

同时相较于传统

［］

８

，

人体的三维几何信息而且对光线变化不敏

和

则对深度运动

ＣｈｅｎａｎＺｈａｎ

ｙｇ

ꢀ

ＹｉｎｌｉＴｉａｎ

ｇ ꢀ

ｇ

［

］

１７

。，

基于此本文以深度视频数据为研究对

（

，

ＤｅｔｈＭｏｔｉｏｎＭａＤＭＭ

ｐ ꢀ

ꢀ ｐ

），

特征进行扩展提

图

感

（

ＤＭＭＥｄｅＥｎｈａｎｃｅｄＤＭＭ

ｇꢀ

，

象通过构建基于

，

的深度神经网络结构并

出了边加强

ＣＮＮ

ꢀ

２

ꢀ

ＥＤＭＭ

）

特征

。

融合全局的人体行为信息和局部的手部动作等多

，

尺度信息使用传统的二维

基于人工特征提取的人体行为识别的研究取

来研究三维的

ＣＮＮ

［］

９

，

。

人体行为识别本文的创新在于

：

得了很多优秀成果

然而也存在一些难以解决

：，

的问题提取的特征对训练数据具有依赖性不易

（）

使用图像处理中的二维

１

构建深度

ＣＮＮ

全部评论(0)

暂无评论

评论赚积分>>

上传资源上传优质资源有赏金

构建多尺度深度卷积神经网络行为识别模型

资料介绍

部分文件列表

部分页面预览

相关下载

全部评论(0)

热门标签

最新上传

热门下载

资料专题

推荐下载

专栏首页