推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

一种基于多层RBM网络和SVM的行人检测方法研究

更新时间:2019-12-26 15:14:26 大小:766K 上传用户:IC老兵查看TA发布的资源 标签:rbm网络svm行人检测方法 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

行人检测一直是计算机视觉领域的热点和难点问题。本文提出了一种结合玻尔兹曼机RBM(Restricted Boltzmann Machine)和支持向量机SVM(Suport Vector Machines)的深度学习网络进行行人特征提取和分类,多层玻尔兹曼机无监督的训练网络参数得到行人特征并级联SVM构建特征分类器进行特征分类,在融合多种行人数据库的基础上扩充了行人数据样本,满足深度学习对于大数据量样本的要求。实验中对比了不同层数网络对于模型性能的影响以及与传统人工特征相比在复杂场景下的行人检测效果,验证了深度学习对于行人特征提取的有效性。


部分文件列表

文件名 大小
一种基于多层RBM网络和SVM的行人检测方法研究.pdf 766K

部分页面预览

(完整内容请下载后查看)
卷第  
道 学  
ꢀꢀ ꢀꢀ ꢀꢀ  
40  
3  
2018  
ꢀꢀꢀ  
URNAA RWATY  
ꢀ ꢀ ꢀ ꢀ ꢀ  
rch 2018  
( )  
1003601096  
文章编号  
一种基于多层  
网络和  
的行人检测方法研究  
M  
M  
ꢀ ꢀ  
ꢀ ꢀ  
ꢀ ꢀ  
王 银  
王立德  
邱 霁  
申 萍  
杜 欣  
100044  
北京交通大学 电气工程学院 北京  
stcted  
人检测一直是计算机视觉领域的热点和难点问题 本文提出了一种结合玻尔兹曼机  
( )  
ctochines  
ꢀ ꢀ  
和支持向量机  
的深度学习网络进行行人特征提取和分类 多  
chine  
构建特征分类器进行特征分类 在融合多种行  
层玻尔兹曼机无监督的训练网络参数得到行人特征并级联  
M  
人数据库的基础上扩充了行人数据样本 满足深度学习对于大数据量样本的要求 实验中对比了不同层数网络  
对于模型性能的影响以及与传统人工特征相比在复杂场景下的行人检测效果 验证了深度学习对于行人特征提  
取的有效性  
关键词 人检测 玻尔兹曼机 支持向量机 无监督训练 深度学习  
: ;  
98 317  
ꢀꢀ  
: /  
969 ss00360114  
中图分类号  
文献标志码  
ꢀꢀ  
searcedeiaechosen  
ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ  
twM  
ꢀ ꢀ ꢀ ꢀ  
DU in  
NG  ide  HEin  
ꢀ ꢀ ꢀ  
Schoectcaeein  oton iver 00044 a  
ꢀ ꢀ g j g j g  
tracedeteceesutes  
ꢀ ꢀ ꢀ ꢀ ꢀ  
 ꢀ  
ee earnin nehastctenn chine ctoa  
pp  
-  
chines  s rseor edesteaturracascansrvseinin t  
p p -  
rk arter nn chinse et edestharactecs ch re  
ꢀ  
ꢀ ꢀ p  
oneaturaseaturascasenti  
ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ -  
ous edeatabases the edestinin s ndentee  
ꢀ ꢀ ꢀ ꢀ  
learnin foat nt thfectrkferenhe er  
ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ -  
foncree edeetecfecrei  
ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ -  
eaturecenefecivenesee earnin for edesteaturracn  
ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ  
.  
);  
Ke wrds desttecestctechine  ectochinensu  
);  
ervseinin dee learnin  
; 、  
外研究热点 同时由于现实生活中行人在衣着 形态变  
行人检测技术由于应用的广泛性使其在计算机视  
ꢀꢀ  
, 、  
觉领域成为一个重要分支 其在视 频监控 机器人视  
、 、  
化 所处背景的多样性以及光照强弱 行人之间的相互  
、 、  
觉 汽车自动驾驶 虚拟现实技术以及基于内容的视频  
遮挡问题也使得行人检测成为计算机视觉领域内的难  
[]  
检索等多个领域中具有重要的作用 因此一直是国内  
点问题  
铁路车站环境下正是存在着这样的行人检  
测难点问题 而在多突发事件的列车车站环境下人工  
2019  
事后排查监控视频效率极低 因此基于视频检索技术  
收稿日期  
修回日期  
2019  
- -  
基金项目 国铁路总公司科技研究开发计划  
201H  
,  
安徽铜陵人 博士研究生  
第一作者  
6117393 n  
的研究对改变目前的调查取证方式有着非常 大的意  
1989  
j  
义 行人检测正是针对监控视频检索技术的核心技术  
通信作者 立德  
,  
北京人 教授 硕士  
1960  
 n  
j  
也是保证检索准确度的首要条件  
道 学  
ꢀꢀ ꢀꢀ ꢀꢀ  
40  
96  
目前行人检测技术按照特征提取模式可以分为两  
ꢀꢀ  
行人特征提取及分类  
行人训练数据库的扩建  
类 基于人工特征的行人检测和基于深度学习的行人  
检测 基于人工特征的行人检测在近几十年的发展当  
1  
中无论在检测精度上还是检测速度上都取得了长足的  
到目前为止 在行人检测领域各研究机构开放了  
aBooar  
进步  
等提出了  
2001 Vola  
多个行人数据库 其中比较常见的有  
数据库 包  
T  
像素  
[]  
人检测算法  
通 过  
方法从大量简单  
aBoot  
张行人图片 宽高为  
)、  
IA  
924  
×28  
特征 中 选 取 判 别 能 力 强 的 特 征 进 而 进 行 分  
ar  
902  
张图片 包括  
)、  
据库  
个行人 行人未分割  
42  
类 取得良好的效果  
2005 Dlal  
等提出梯度方向直  
行人数据库 两种大小的行人图片各  
imer  
60  
HOG nteadents  
方图  
特征  
[]  
ꢀ ꢀ  
)、  
tech  
行人数据库 视频数据 视频中对行人进  
结合简单的线性支持向量机 取得了非常好的效果  
) ,  
行了标注 等 这些数据库多数是在基于传统人工行人  
之后  
等采用积分直方图技术快速计算  
[]  
特征  
Zhu  
HOG  
特征的训练环境下建立的 数据量较小且各数据库之  
提高了行人检测的速度  
在之后的研究中研究人员  
间由于数据格式不兼容 无法满足深度学习对于高质  
特征和 多种 特 征相 融合 也 取 得 了 一 定 的 效  
HOG  
量大数据量训练数据的要求 因此本文在对现有行人  
果 但是仍不可避免的是采用了基于人工定义的特征  
数据库兼容 整合的基础上人工提取了大量监控视频  
其对于复杂背景及遮挡问题检测效果尚差人意 随着  
[]  
的行人图片及负样本图片并进行了标注 所有图片大  
2006 Hntn  
等提出深度学习框架 采用 逐层初  
像素 其中扩充完成的行人数据库  
小定义为  
×28  
” 、  
始化 的方式来克服训练上的难度 采用多隐层结构来  
部分行人样本见图  
提高特征学习能力获得特征的非线性表达 其强大的  
特征提取能力和泛化能力显示了深度学习在机器视觉  
领域的优点 继而各种深度学习架构在短短十余年中  
相继提出 近几年开始出现将深度学习引入到行人检  
2013  
港中文大学欧阳万里提出  
测领域的研究  
[]  
方法  
Joine  
利用  
网络提取行人特征进行  
CNN  
行人检测 文章结合行人遮挡模型和形变模型取得了  
"+$"#,  
")$"#*  
"#$"#! "%$"#&  
"$"#(  
不错的效果 同年  
根据卷积稀疏  
ertes  
[]  
编码提出 非监 督 方法  
进行行人检测也  
ConU  
[]  
取得了一定的效果  
利用  
卷积神经网  
ez  
3D  
进行  
NN onvluurarks  
[]  
人体行为的识别  
卷积神  
insn  
t  
经网络结构应用到移动机器人的视觉系统中来进行行  
[ ]  
10  
人的检测 而  
月提出  
un im  
2016  
"-$"#. "/$"#0  
"1$"#2 "3$"#4  
"5$"#!6  
DCNs D onvlul  
将深 度 卷 积 神 经 网 络  
!! "#$%&’(  
行人多层玻尔兹曼机训练模型结构  
应用到多普勒雷达采集到的信息进  
urarks  
2  
行行人的检测以及分类上 检测准确率达到了  
6%  
为对比不同深度的网络模型对于特征提取能力的  
分类准确率达到了  
9%  
, ,  
影响 分别建立多层网络结构 每个网 络 均 包含多层  
本文提出了将玻尔兹曼机级联  
分类器应用  
M  
[ ]  
11  
网络 及最后一层  
分类器 多层  
M  
M  
M  
到视频图像中进行行人的检测及特征提取 所建立的  
dea  
y  
络中每层由显层  
及隐层  
blr  
y  
训练网络中包含多层玻尔兹曼机无监督网络进行特征  
构成 显层由显元组成 相应的隐层由隐元组成 显  
er  
分类器进行特征的分类 本文  
提取及最后一层  
M  
层和隐层内部神经元之间没有互联 相邻层之间神经  
同时对比了不同层数训练网络对于行人特征提取能力  
元全连接 通过自下而上的学习形成特征多层的抽象  
的影响 最后结果显示多层  
网络的非线性深层  
M  
表示 多层深度网络结构见图  
次网络结构模型能够很好地表征行人特征 在复杂环  
境下较之于传统基于人工特征的行人检测方法具有很  
第 一 层  
网 络 的 显 层 为 输 入 的 行 人 数  
M  
据 由行人数据集特征可计算输入向量维数为  
92  
大的优势  
层间连接权值为  
后面每个  
网络的输入层均  
M  
ω

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载