推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

改进的YOLO特征提取算法及其在服务机器人隐私情境检测中的应用

更新时间:2019-12-26 11:58:36 大小:1M 上传用户:IC老兵查看TA发布的资源 标签:特征提取算法机器人 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

为了提高YOLO识别较小目标的能力,解决其在特征提取过程中的信息丢失问题,提出改进的YOLO特征提取算法.将目标检测方法 DPM与R-FCN融入到YOLO中,设计一种改进的神经网络结构,包含一个全连接层以及先池化再卷积的特征提取模式以减少特征信息的丢失.然后,设计基于RPN的滑动窗口合并算法,进而形成基于改进YOLO的特征提取算法.搭建服务机器人情境检测平台,给出服务机器人情境检测的总体工作流程.设计家居环境下的六类情境,建立训练数据集、验证数据集和4类测试数据集.测试分析训练步骤与预测概率估计值、学习率与识别准确性之间的关系,找出了适合所提出算法的训练步骤与学习率的经验值.测试结果表明:所提出的算法隐私情境检测准确率为94.48%,有较强的识别鲁棒性.最后,与YOLO算法的比较结果表明,本文算法在识别准确率方面优于YOLO算法.


部分文件列表

文件名 大小
改进的YOLO特征提取算法及其在服务机器人隐私情境检测中的应用.pdf 1M

部分页面预览

(完整内容请下载后查看)
44 卷 第 12 期  
2018 12 月  
Vol. 44, No. 12  
ACTA AUTOMATICA SINICA  
December, 2018  
改进的 YOLO 特征提取算法及其在服务机器人  
隐私情境检测中的应用  
苏志东 1  
杨观赐 1  
杨 静 1  
陈占杰 1  
为了提高 YOLO 识别较小目标的能力, 解决其在特征提取过程中的信息丢失问题, 提出改进的 YOLO 特征提取算  
. 将目标检测方法 DPM R-FCN 融入到 YOLO , 设计一种改进的神经网络结构, 包含一个全连接层以及先池化再卷  
积的特征提取模式以减少特征信息的丢失. 然后, 设计基于 RPN 的滑动窗口合并算法, 进而形成基于改进 YOLO 的特征提取  
算法. 搭建服务机器人情境检测平台, 给出服务机器人情境检测的总体工作流程. 设计家居环境下的六类情境, 建立训练数据  
证数据集和 4 类测试数据集. 测试分析训练步骤与预测概率估计值习率与识别准确性之间的关系, 找出了适合所  
提出算法的训练步骤与学习率的经验值. 测试结果表明: 所提出的算法隐私情境检测准确率为 94.48 %, 有较强的识别鲁棒性.  
最后, YOLO 算法的比较结果表明, 本文算法在识别准确率方面优于 YOLO 算法.  
关键词 YOLO, 特征提取算法, 服务机器人, 隐私情境检测, 智能家居  
引用格式 杨观赐, 杨静, 苏志东, 陈占杰. 改进的 YOLO 特征提取算法及其在服务机器人隐私情境检测中的应用. 自动化学  
, 2018, 44(12): 22382249  
DOI 10.16383/j.aas.2018.c170265  
An Improved YOLO Feature Extraction Algorithm and Its Application to  
Privacy Situation Detection of Social Robots  
YANG Guan-Ci1  
YANG Jing1  
SU Zhi-Dong1  
CHEN Zhan-Jie1  
Abstract To address the limitation of YOLO algorithm in recognizing small objects and information loss during feature  
extraction, we propose FYOLO, an improved feature extraction algorithm based on YOLO. The algorithm uses a novel  
neural network structure inspired by the deformable parts model (DPM) and region-based fully convolutional networks  
(R-FCN). A sliding window merging algorithm based on region proposal networks (RPN) is then combined with the  
neural network to form the FYOLO algorithm. To evaluate the performance of the proposed algorithm, we develop a  
social robot platform for privacy situation detection. We consider six types of situations in a smart home and prepare  
three datasets including training dataset, validation dataset, and test dataset. Experimental parameters such as training  
step and learning rate are set in terms of their relationships with the prediction accuracy. Extensive privacy situation  
detection experiments on the social robot show that FYOLO is capable of recognizing privacy situations with an accuracy  
of 94.48 %, indicating the good robustness of our FYOLO algorithm. Finally, the comparison results between FYOLO  
and YOLO show that the proposed FYOLO outperforms YOLO in recognition accuracy.  
Key words YOLO, feature extraction algorithm, social robot, detection of privacy situations, smart homes  
Citation Yang Guan-Ci, Yang Jing, Su Zhi-Dong, Chen Zhan-Jie. An improved YOLO feature extraction algorithm  
and its application to privacy situation detection of social robots. Acta Automatica Sinica, 2018, 44(12): 22382249  
越来越多的智能家居系统和服务机器人广泛使  
收稿日期 2017-05-15 录用日期 2017-08-29  
Manuscript received May 15, 2017; accepted August 29, 2017  
国家自然科学基金 (61863005, 61640209), 贵州省科技计划项目 (黔  
用摄像头 这会引入隐私泄漏风险 是阻碍此类系统  
推广的最大障碍之一[1] 前期问卷调查表明[2] 对隐  
科合人字 (2015) 13, 黔科合 JZ [2014] 2004, 黔科合 LH [2016]  
私内容有符合人心理需求反应的系统 可改善用户  
7433, 黔科合平台人才 [2018] 5702), 贵州省教育厅研究生教改重点课  
体验感受 如何识别与保护具有视觉设备的服务机  
[3]  
(黔教研合 JG [2015] 002) 资助  
Supported by National Natural Science Foundation of China  
器人的隐私数据是值得研究的问题  
(61863005, 61640209), Science and Technology Foundation of  
Guizhou Province ((2015) 13, JZ [2014] 2004, LH [2016] 7433,  
PTRC [2018] 5702), and Graduate Education Reform Fund of  
计了一种智能家居环境中隐私与安全框架  
[4] 通过分析智能家居环境下各系统间的安全和隐  
Education Bureau of Guizhou Province (JG [2015] 002)  
本文责任编委 胡清华  
私与互信风险 研究了高度依赖法律支持的隐私控  
Recommended by Associate Editor HU Qing-Hua  
1. 贵州大学现代制造技术教育部重点实验室 贵阳 550025  
1. Key Laboratory of Advanced Manufacturing Technology of  
Ministry of Education, Guizhou University, Guiyang 550025  
12 期  
杨观赐等: 改进的 YOLO 特征提取算法及其在服务机器人隐私情境检测中的应用  
2239  
制机制私风险分级方法 这些研究主要从数据  
访问控制等角度考虑信息安全 没有提出数据获取  
在训练过程中对数据集特征提取 网络中的  
单元格最多负责预测一个真实目标 这导致  
检测相对靠近且较小的目标时效果欠佳  
阶段的敏感数据识别与保护方案  
[5]  
出 即使智能服务机器人使用加密和认证方式 网络  
攻击者也有机会控制机器人或提取敏感数据  
在学术界 图像特征提取方法是研究的热点[6]  
在图像预处理阶段  
将训练数据集的  
高分辨率图像处理为低分辨率数据并用于最终的分  
类特征的提取 经过多次卷积后 原始图片分布区域  
中的小目标特征难以保存  
文献  
通过映射聚合层中各个点的值为  
各个点的激活概率均值 得到一种均值聚合机制 虽  
然此方法的准确率高于基于聚合层进行图像特征提  
取方法[8] 但是特征提取过程复杂 模型训练时间较  
使用服务机器人引起的道德问题没有被充分考  
虑 伦理原则应该体现到服务机器人的研发中[24]  
课题组在研发服务机器人时 采用  
环境中不同情境 为了提高  
识别家庭  
长 文献  
通过定义新的结构元和自适应向量融合  
神经网络对较  
模型 提出一种加权量化方法自适应融合图像目标  
和背景 当图像背景与目标均较大时 该方法能体现  
图像全局特征的相关性 但当目标较小时相关性表  
小目标的识别能力 解决其在特征提取过程中信息  
丢失的问题 本文提出了改进的 特征提取算  
法 并将其应用于服务机器人隐私情境检测  
征变得困难 文献  
采用  
滤波器[11] 和局  
1 目标实时检测模型 YOLO  
部模式分析来提取特征 虽然该方法可以获得较多  
的灰度图像特征 但在图像预处理和测试阶段需要  
将图像归一化大小 不能检测随机大小的图片 此类  
特征提取方法对小规模数据集的特征提取具有很好  
的表现能力 但对海量数据 特别是复杂背景环境下  
的数据 其特征提取能力有待进一步提高  
[12]  
目标实时检测模型  
包括  
个卷积  
层、 个全连接层和 个池化层 其中卷积层用于提  
取图像特征 全连接层预测图像位置与类别估计概  
率值 池化层负责缩减图片像素  
根据输入  
的图像数据 运用回归分析法输出图像数据的多个  
滑动窗口位置及该窗口中检测到的目标类别  
[12]  
是一种基于卷积神经网络的目  
将输入图像分成  
×
个单元格 每个  
标实时检测模型 因其具有海量数据的学习能力点  
对点的特征提取能力以及良好的实时识别效果而备  
单元格的神经元负责检测落入该单元格的对象 最  
多可包括两个预测对象的滑动窗口 滑动窗口的信  
受关注[1314] 文献  
拟背景特征 提出基于高斯混合模型和  
人检测算法 在检测变电站监控视频中的行人时取  
得良好效果 文献  
利用交替方向乘子法[17] 提取  
灰度图像上下文信息特征 并将该信息组合成一个  
通过使用高斯混合模型模  
的行  
息采用五元组  
格子神经元预测到的检测对象的置信度中心位置的  
横坐标与纵坐标 分别是滑动窗口的宽度和  
表示  
是当前  
高度 是置信度 它反映当前滑动窗口是否包含检  
测对象及其预测准确性的估计概率 计算公式为  
输入通道作为  
成了基于  
神经网络模型的输入 形  
的实时目标检测算法 虽然识别精  
×
o
IOU  
度有所提高 但是模型的时间开销较大 文献  
计了提取图像内文本字符的机制 并采用  
其中  
表示滑动窗口包含检测对象的概率  
o
IOU  
表示滑动窗口与真实检测对象区域的重叠面积 单  
行文本检测和边界框回归 文献  
评估了目标检  
[20]夫森林[21]  
在检测速度和识别精度上都要  
位是像素 若滑动窗口中包含检测对象 则  
测算法  
o
否则  
的最大  
面积最大的检测对象输出  
通常 若 为每个单元格可以用于预测对象的  
当单元格具有多个滑动窗口时 它们  
值将代入式 计算 最终只选择重叠  
IOU  
性能 并指出  
o
高于两种比较算法 上述这些研究就提高  
性能展其应用等方面做了许多工作 但是采用  
神经网络解决图像的特征提取问题时 存在  
以下不足[2223]  
滑动窗口数量  
为类别总数 则  
的全连接  
层的输出维度是  
×
×
×
在识别的过程中  
将需要识别的图像  
的损失函数计算公式为  
分割为 × 的网格 单元格内用于预测目标的神经  
元可以属于若干个属于同一类别的滑动窗口 这使  
得模型具有很强的空间约束性 若滑动窗口内涵盖  
多个不同类别的对象时 系统无法同时检测出全部  
的目标对象  
loss  
c
IOU  
class  
其中  
分别表示预测数据与标定  
误差与分类误差  
c
IOU  
class  
数据之间的坐标误差、  
IOU  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载