推荐星级:
- 1
- 2
- 3
- 4
- 5
基于兴趣区域深度神经网络的静态面部表情识别
资料介绍
通过在面部表情数据集上训练深度卷积神经网络、深度稀疏校正神经网络两种模型,对两种深度神经网络在静态面部表情识别方面的应用作了对比和分析.基于面部表情的结构先验知识,提出一种面向面部表情识别的改良方法——K兴趣区域方法,该方法在构建的开放实验数据集上,降低了由于训练数据过少而导致深度神经网络模型泛化能力不佳的问题,使得混合模型普遍且显著地降低了测试错误率.进而,结合实验结果进行了深入分析,并对深度神经网络在任意图像数据集上的可能有效性进行了深入剖析和分析.
部分文件列表
文件名 | 大小 |
基于兴趣区域深度神经网络的静态面部表情识别.pdf | 2M |
部分页面预览
(完整内容请下载后查看)5
Vol. 45 No. 5
May 2017
第
期
电
子
学
报
2017
5
ACTA ELECTRONICA SINICA
年
月
基于兴趣区域深度神经网络的
静态面部表情识别
,
孙 晓 潘 汀
(
,
合肥工业大学计算机与信息学院 安徽合肥
230009)
:
、 ,
通过在面部表情数据集上训练深度卷积神经网络 深度稀疏校正神经网络两种模型 对两种深度神经
摘
要
. ,
网络在静态面部表情识别方面的应用作了对比和分析 基于面部表情的结构先验知识 提出一种面向面部表情识别的
———K
, ,
兴趣区域方法 该方法在构建的开放实验数据集上 降低了由于训练数据过少而导致深度神经网络模
改良方法
, . , ,
型泛化能力不佳的问题 使得混合模型普遍且显著地降低了测试错误率 进而 结合实验结果进行了深入分析 并对深
.
度神经网络在任意图像数据集上的可能有效性进行了深入剖析和分析
:
K
;
;
;
关键词
中图分类号
URL: http: / /www. ejournal. org. cn
兴趣区域 深度神经网络 深度学习 面部表情识别
:
TP391
:
A
: 0372-2112 ( 2017) 05-1189-09
DOI: 10. 3969 /j. issn. 0372-2112. 2017. 05. 023
文献标识码
文章编号
电子学报
Static Facial Expression Recognition
System Using ROI Deep Neural Networks
SUN Xiao,PAN Ting
( School of Computer and Information,Hefei University of Technology. Hefei,Anhui 230009,China)
Abstract: By building two models including Deep Convolutional Neural Networks and Deep Sparse Rectifier Neu-
ral Networks on facial expression dataset,we made contrastive evaluations in facial expression recognition system with
deep neural networks. Based on prior structure knowledge of facial expression,we proposed a fast and simple improved
method called K Region Of Interest--‘K-ROI’,which relieved the poor generalization of deep neural networks on experi-
mental dataset due to insufficient data and decreased the testing error rate apparently and generally. Finally,we infer the
experimental results and analyze comprehensively for the possible validity with deep neural networks on arbitrary image
dataset.
Key words: K-ROI; deep neural networks; deep learning; facial expression recognition
. ,
很好的测试结果 然而 基于
CK + (
1 )
如图 所示 数据
1
引言
, . ,
集训练拍摄角度正规 而且数量少 因而 现有大多数系
,
在面部表情识别领域 随着深度神经网络的提出
,
CK +
( 95% ) ,
数据集获得高准确率 并不能断言
统基于
可以超越人类的识别能力
本文的第二部分将介绍相关研究工作 第三部分
“
, ”
先提取特征 后模式识别 的规则被打破
. Krizhevsky
.
[1]
ILSVRC-2012 ,
图像识别竞赛中 利用深度卷积
等人
神经网络的自适应特征提取能力 使模型成绩远远超
SIFT
在
.
,
.
构建两种面向面部表情识别的深度神经网络 第四部
.
,
过了
别任务上
特征提取和判别分类两个步骤统一结合 在
等传统人工特征的成绩 最近 在面部情感识
.
分介绍实验测试结果与分析 第五部分对抽象神经网
[2]
,Lopes
,
,
络提出假设计算模型 尝试对实验结果给出合理解释
.
等
尝试引入卷积神经网络模型 将
Extended
静态面部表情数据集上取得了
.
,
最后的第五部分是总结与展望
[3]
Cohn Kanade ( CK + )
: 2016-02-16;
: 2016-06-14;
:
责任编辑 蓝红杰
收稿日期
修回日期
:
基金项目 安徽省自然科学基金
( No. 1508085QF119) ;
( No. 61432004) ;
( No.
模式识别国家重点实验室开放课题
国家自然科学基金重点项目
( No. 2015M580532)
NLPR201407345) ;
中国博士后科学基金
1190
2017
年
电
子
学
报
[12]
Glorot
提出的深度稀疏校正神经网络从结构上
,
仍然属于全连接神经网络 唯一变化是将激活函数替
[13]
ReLU. Barron
、N
换成
证明了拥有一个隐层
个神经元
1 /N
.
的全连接神经网络可以将任何函数拟合至
精度
从生理学角度证明了图像识别函数可
[14]
Hubel&Wiesel
,
以由多个函数组合而成 增加神经网络的深度要比广
[15 ~ 19]
.
度有效得多
3
深度神经网络结构与超参数设计
2
相关工作
3. 1
深度卷积神经网络的设计
,
针对静态面部表情识别的任务 即从一个图像中
2. 1
关注点机制
[4 ~ 6]
,
识别出其中人物面部的表情 首先构建一个卷积神经
Jaderberg
,
等人提出空间变换网络 可嵌入关注
. 4,
网络 如图 针对输入大小为
32x32
(
的灰度图 彩色维
,
点机制 来引导神经网络学习图像数据中的空间变换
1) , 3 &MaxPooling ,1
构建了 个卷积 层 个全连接
度为
,1
层
.
不变性 关注点机制可以通过对训练数据的空间变换
Softmax . 4 .
层 如图 所示 根据各层神经元个数
个
.
生成得到 他们将空间变换网络用于鸟的检测任务当
,
的不同 又分为
:
. ,
中 通过对两组空间变换参数训练 最终验证了关注点
CNN-64: [32,32,64,64]
CNN-96: [48,48,96,200]
CNN-128: [64,64,128,300]
: ,
学习的有效性 一组参数寻找鸟头 一组参数寻找鸟身
,
2
如图 所示
.
3. 2
深度稀疏校正神经网络的设计
,
为了对比验证 构建了一个深度稀疏矫正神经网
2. 2
深度神经网络
[7]
. 5,
络 如图 针对输入大小为
32x32
(
的灰度图 彩色维度
LeCun
1990 ,
年提出深度卷积神经网络 如
等
在
[8]
1) , 3
构建 个全连接层
,1
Softmax .
层
为
个
3
,
所示 以
Fukushima
,
的感知机结构为基础 借
图
等
[9]
,
:
根据各层神经元个数的不同 又分为
DNN-1000: [1000,1000,1000]
DNN-2000: [2000,2000,2000]
Rumelhart
,
的反向传播训练算法 首先在图像识
助
等
[10]
.
别领域取得巨大成功
卷积神经网络相比一般的全
Smooth
,
连接神经网络 除了在模型中注入
先验知识之
[11]
,
外 还注入一些面向具体任务的先验知识
.
3. 3
K
兴趣区域方法
[20]
Sun Y
等人 在利用深度卷积神经网络训练人脸
, ,
特征时 采取对单张图片不同尺度区域切割的方法 来
. , ,
扩大数据集 以此为启发 根据人脸的面部结构 设置了
9
ROI( Region of Interesting) , 6,
如图
个不同的兴趣区域
9
,
个区域也是直观上人判断情感的关注区域 通过设
这
9 ,
置这 个区域 主动引导神经网络关注与表情相关的面
.
部区域
、 、
兴趣区域分割方案重点关注眼 鼻 嘴在不同表情
全部评论(0)