推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于改进的Fisher准则的多示例学习视频人脸识别算法

更新时间:2020-01-02 22:04:59 大小:1M 上传用户:IC老兵查看TA发布的资源 标签:人脸识别 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

视频环境下目标的姿态变化使得人脸关键帧难以准确定位,导致基于关键帧标识的视频人脸识别方法的识别率偏低.为解决上述问题,本文提出一种基于Fisher加权准则的多示例学习视频人脸识别算法.该算法将视频人脸识别视为一个多示例问题,将视频中归一化后的人脸帧图像作为视频包中的示例,采用分块TPLBP级联直方图作为示例纹理特征,示例特征的权值通过改进的Fisher准则获得.在训练集合的示例特征空间中,采用多示例学习算法生成分类器,进而实现对测试视频的分类及预测.通过在Honda/UCSD视频库和Youtube Face数据库中的相关实验,该算法达到了较高的识别精度,从而验证了算法的有效性.同时,该方法对均匀光照变化、姿态变化等具有良好的鲁棒性.


部分文件列表

文件名 大小
基于改进的Fisher准则的多示例学习视频人脸识别算法.pdf 1M

部分页面预览

(完整内容请下载后查看)
44 卷 第 12 期  
2018 12 月  
Vol. 44, No. 12  
ACTA AUTOMATICA SINICA  
December, 2018  
基于改进的 Fisher 准则的多示例学习视频人脸识别算法  
2
3
3
3
王 玉 1  
申铉京 1  
陈海鹏 1  
视频环境下目标的姿态变化使得人脸关键帧难以准确定位, 导致基于关键帧标识的视频人脸识别方法的识别率偏低.  
为解决上述问题, 本文提出一种基于 Fisher 加权准则的多示例学习视频人脸识别算法. 该算法将视频人脸识别视为一个多示  
例问题, 将视频中归一化后的人脸帧图像作为视频包中的示例, 采用分块 TPLBP 级联直方图作为示例纹理特征, 示例特征的  
权值通过改进的 Fisher 准则获得. 在训练集合的示例特征空间中, 采用多示例学习算法生成分类器, 进而实现对测试视频的  
分类及预测. 通过在 Honda/UCSD 视频库和 Youtube Face 数据库中的相关实验, 该算法达到了较高的识别精度, 从而验证  
了算法的有效性. 同时, 该方法对均匀光照变化姿态变化等具有良好的鲁棒性.  
关键词 视频人脸识别, 局部二值模式, 多示例学习, Fisher 准则  
引用格式 王玉, 申铉京, 陈海鹏. 基于改进的 Fisher 准则的多示例学习视频人脸识别算法. 自动化学报, 2018, 44(12): 2179  
2187  
DOI 10.16383/j.aas.2018.c170090  
Video Face Recognition Based on Modified Fisher Criteria and  
Multi-instance Learning  
2
3
3
3
WANG Yu1  
SHEN Xuan-Jing1  
CHEN Hai-Peng1  
Abstract Due to the pose variation of target in video, it is difficult to accurately locate the face key frame and have a  
high recognition rate of the video face recognition based on key frame identification. To solve these problems, a video face  
recognition algorithm based on multi-instance learning is proposed in this paper. The algorithm takes each face video as  
a bag, and each normalized face frame as an instance in the bag. The feature of each instance is represented by cascading  
histograms of block TPLBP codes, and the weight of the instance feature is obtained by the improved Fisher criteria.  
The classifier is obtained in the feature space of training set by using a multiple instance learning algorithm, and then  
classification and prediction of test bag are realized. Experiments on the Honda/UCSD and YouTube Face databases show  
that the algorithm can achieve a higher recognition accuracy, and at the same time, the method is robust to illumination  
variation and expression variation.  
Key words Video-based face recognition, local binary patterns (LBP), multi-instance learning, Fisher criteria  
Citation Wang Yu, Shen Xuan-Jing, Chen Hai-Peng. Video face recognition based on modified Fisher criteria and  
multi-instance learning. Acta Automatica Sinica, 2018, 44(12): 21792187  
视频人脸识别是计算机视觉式识别频  
分析与理解等领域的重要研究课题 视频人脸识别  
的研究不仅在理论上具有重大意义 同时在生物特  
征鉴别频监控息安全等领域具有广泛的应  
用前景 已经成为人脸识别领域的研究热点和难点  
问题[1]  
视频环境下人脸识别中的关键问题是确定整个  
视频中对识别结果起决定性作用的最具代表性帧  
而对整个视频进行分析并选取关键帧的做法往往是  
不现实的 目前 绝大多数的视频人脸识别都是通过  
提取视频序列中包含人脸的关键帧 采用基于静态  
图像的人脸识别算法达到视频分类的目的 其中包  
括多视角融合空间或流形分析[2] 等 该类方法  
中关键帧的选择歧义性较大 需要对整个视频进行  
分析才能实现关键帧的准确定位 降低了视频人脸  
识别系统的效率和实时性要求 适合于人物目标配  
照及视角良好并且视频质量较高的环境下的  
应用  
收稿日期 2017-02-24 录用日期 2017-07-12  
Manuscript received February 24, 2017; accepted July 12, 2017  
国家青年科学基金 (61305046, 61602203), 吉林省优秀青年人才基金  
(20180520020JH) 资助  
Supported by National Science Foundation for Young Scientists  
of China (61305046, 61602203) and Outstanding Young Talent  
Foundation of Jilin Province (20180520020JH)  
本文责任编委 杨健  
Recommended by Associate Editor YANG Jian  
1. 吉林大学计算机科学与技术学院 长春 130012 2. 吉林大学应用  
技术学院 长春 130012 3. 吉林大学符号计算与知识工程教育部重点  
实验室 长春 130012  
1. College of Computer Science and Technology, Jilin Univer-  
sity, Changchun 130012 2. Applied Technology College, Jilin  
3. Key Laboratory of Sym-  
University, Changchun 130012  
bolic Computation and Knowledge Engineering of Ministry of  
Education, Jilin University, Changchun 130012  
近年来 基于图像集合和基于视频序列的视频  
人脸识别方法得到了广泛关注 其中 基于图像集合  
2180  
44 卷  
的视频人脸识别方法是将视频作为一个无序的帧图  
像集合 通过流形[35]空间[6][7]协  
以准确定位导致的识别率偏低等问题 本文提出一  
种基于多示例学习的视频人脸识别算法 多示例  
学习[14] 算法对于解决视频分类这种多示例问题性  
能优越 已经应用于视频事件检测[15]怖视频分  
方差矩阵[8] 等对图像集合进行建模以实现视频人脸  
[9]  
的识别  
国际计算机  
视觉与模式识别会议  
[16] 等领域  
[17] 将多示例学习模型用于  
新闻视频中的人脸标识 并提出  
提出了基于图像集合的视频人脸识别方法 指出该  
类方法包括两个主要方面 如何对人脸图像集合  
进行建模 如何度量模型之间的相似度 通过凸  
包和仿射变换对图像集合建模并度量模型之间的几  
何距离以实现视频人脸识别  
[10] 在此基础上  
提出了基于 的图像集合视频人脸识别方法  
两种可辨别概率模型用于解决这类  
多示例问题 多示例学习模型被认为非常适合低信  
噪比或数据缺失严重的环境下的概念学习 受到机  
器学习界广泛的重视并成为当前研究的热点之一  
对于解决像视频人脸识别这样的实际应用问题  
虽然单个视频对象中只包含同一类目标 我们可以  
将视频中的每一个帧图像作为一个目标描述 但是  
由于光照姿态变化及表情的影响 一个视频对象可  
能同时存在多个描述 而这些图像描述中往往只有  
一个或几个描述具有决定性 即所谓的关键帧 而到  
底哪个图像描述可以决定视频对象的类别往往是不  
确定的 而多示例学习算法正是解决这种 对象 描  
相比之前的算法 能得到更好的性能 于谦等[11]  
出了判别性联合多流形分析  
方法 该方法  
将基于视频的人脸识别转换为图像集识别问题 并  
提出用类间流形示每个图像集的平均脸信息 用类  
内流形表示每个图像集的所有原始图像的信息 采  
用分片技术学习两种流形的投影矩阵 并提出了与  
分片技术相匹配的流形之间的距离度量方法 实验  
结果表明 该方法在几个公开研究的视频库中 比现  
有的方法具有更高的识别正确率  
述 类别 之间的  
关系的学习模型 并被  
认为是与三种传统学习框架并列的第四种学习框架  
本文的主要工作是将多示例学习方法应用于视  
频人脸识别 以解决传统方法需要在视频中准确定  
位代表性关键帧的难题 本文算法将复杂环境下的  
视频人脸识别问题视为一个多示例问题 将训练集  
基于视频序列的视频人脸识别算法是通过设计  
视频纹理描述算子 引入视频上下文信息等方式提  
高识别精度和效率  
的具有旋转不变性的视频纹理描述算子 该方法在  
数据库中的识别率达到了 但是  
[12] 提出了基于  
合中的每个视频视为一个包  
将视频包中归一  
化处理后的视频帧图像视为包中的示例  
视频包带有标记而视频包中的示例没有标记 如图  
视频纹理算子及视频上下文信息的获取十分困难  
计算复杂度较高 同时 这类算法对人脸表情和目标  
姿态变化等影响识别性能的因素不够鲁棒[1] 视频  
相对于图像提供的可用信息更多 但也会带来更多  
的噪音等干扰因素  
所示 这里包含一个正包  
和一个负包  
利用有效的多示例学习算法在训练  
集合样本空间中学习并生成分类器 以实现对测试  
包的预测及分类  
另外 视频采集环境的光照变化标的姿态  
变化等 都在一定程度上造成了视频人脸识别上的  
困难 为此 本文在算法实现过程中采用了基于改进  
自然视频大多数是非专业人员采集的 视频采  
集设备有限 视频环境光照条件较差 目标姿态多变  
并且伴随运动模糊 同时 为了便于存储及传输 通  
常以压缩格式存储 这些噪音因素的存在都使得解  
决视频人脸识别问题具有极大的挑战性[13] 为实现  
这种低分辨率标姿态多变条件下的视频人脸的  
鲁棒识别 设计能够适应这种复杂环境下的视频人  
脸识别学习算法就变得尤为重要  
加权准则的  
进行示例的纹理特征表示 该算子  
具有较强的可辨别能力 并且对均匀光照变化是鲁  
棒的 实验结果表明 本文算法具有较高的识别精度  
和效率  
算法描述  
1 主要工作  
本文算法主要步骤如下  
视频采集会受到光照情 尤其是姿态变化的  
影响 视频人脸序列中有用信息的出现概率较低 甚  
至会出现严重的数据缺失 视频中有用信息出现的  
时间没有规律可循 用常规的学习方法很难解决这  
种复杂条件下的视频人脸识别  
步骤  
视频包预处理 训练视频集中的每个  
视频 包 带有标记 而视频中的每个帧图像 示例  
没有标记 从视频包中的帧图像 示例 中检测出含  
人脸图像并预处理后 以双眼坐标为基准进行人脸  
归一化处理  
为解决视频环境下人脸识别问题中关键帧难  
步骤  
示例局部纹理特征提取 对包中的每  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载