推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

图像场景分类技术综述

更新时间:2019-12-30 15:32:21 大小:455K 上传用户:songhuahua查看TA发布的资源 标签:图像场景分类 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

目前,基于计算机视觉分析的图像场景分类技术已被广泛研究并应用在众多学科领域中.本文从不同角度对近年来典型的场景分类技术进行了深入的探讨与比较.首先介绍了场景分类技术的背景、应用场景以及发展现状;然后基于特征提取、语义分析和机器学习的角度分别对国内外的相关研究进行系统的分析、比较及总结;最后对目前研究所面临的问题和未来技术的发展给出总结与展望.


部分文件列表

文件名 大小
图像场景分类技术综述.pdf 455K

部分页面预览

(完整内容请下载后查看)
4
第 期  
Vol. 47 No. 4  
Apr. 2019  
2019  
4
年 月  
ACTA ELECTRONICA SINICA  
图像场景分类技术综述  
123  
123  
3
12  
12  
田艳玲 张维桐 张锲石 路 纲 吴晓军  
( 1.  
710062; 2.  
710062;  
陕西师范大学现代教学技术教育部重点实验室 陕西西安  
陕西师范大学计算机科学学院 陕西西安  
3.  
中国科学院深圳先进技术研究院 广东深圳  
518055)  
:
.  
目前 基于计算机视觉分析的图像场景分类技术已被广泛研究并应用在众多学科领域中 本文从不同  
摘 要  
角度对近年来典型的场景分类技术进行了深入的探讨与比较 首先介绍了场景分类技术的背景 应用场景以及发展现  
;
状 然后基于特征提取 语义分析和机器学习的角度分别对国内外的相关研究进行系统的分析 比较及总结 最后对目  
;
前研究所面临的问题和未来技术的发展给出总结与展望  
:
;
;
;
关键词  
中图分类号  
URL: http: / /www. ejournal. org. cn  
场景分类 特征提取 语义分析 深度学习  
:
TP391  
:
A
:
0372-2112 ( 2019) 04-0915-12  
DOI: 10. 3969 /j. issn. 0372-2112. 2019. 04. 020  
文献标识码  
文章编号  
电子学报  
Review on Image Scene Classification Technology  
123  
123  
3 12  
ZHANG Qie-shi LU Gang WU Xiao-jun  
12  
TIAN Yan-ling  
ZHANG Wei-tong  
( 1. Key Laboratory of Modern Teaching TechnologyMinistry of EducationShaanxi Normal UniversityXianShaanxi 710062China;  
2. School of Computer ScienceShaanxi Normal UniversityXianShaanxi 710062China;  
3. Shenzhen Institute of Advanced TechnologyChinese Academy of SciencesShenzhenGuangdong 518055China)  
Abstract: The computer vision based scene classification technology is widely developed and applied in different  
fields. In this paperthe typical scene classification technology is analyzed and compared from the different directions. First,  
the backgroundapplication and development situation is introduced. Thenthe related researches both at home and overseas  
are analyzedcompared and summarized from the perspectives of feature extractionsemantic analysis and machine learning.  
Finallythe problems that the current researches are facing and potential future development are discussed.  
Key words: scene classification; feature extraction; semantics analysis; deep learning  
让计算机以人类的思维逻辑去 理解 图像就是现在要  
1
引言  
着手解决的问题 所谓图像场景分类是指对于已经给  
图像场景分类技术涉及模式识别 计算机视觉系  
定的图像 通过判断识别它所包含的信息和内容来判  
 
统 信号处理及人机交互等学科的交叉领域 是解决图  
.  
断其所属的场景 从而达到分类的目的 随着图像场景  
片搜索 图像识别问题的关键技术 已成为计算机视觉  
分类技术的不断发展 其内涵和范畴也在不断丰富拓  
,  
领域中一个非常重要且极具挑战的研究课题 早期 通  
,  
展 在图像分类发展早期 单幅图像的分类主要通过像  
过人工分类的方法还可以满足一些领域的基本需求  
素之间的关系权重来综合考虑 在人工干预下逐步做  
然而随着网络技术的普及及多媒体信息的爆炸性增  
二类语义分割 确定场景类别 之后 图像场景分类得到  
.  
长 图像内容种类和数量与日俱增 如今面对海量的图  
进一步发展 研究人员通过提取图像整体特征来确定  
像数据 依靠传统人工分类与标注的方式已经远远不  
,  
该图像所属类别 根据应用需求的不同 以及场景在组  
,  
能满足需求 单纯依靠人工分类 不仅极大地浪费人力  
,  
成架构 包含元素等方面的巨大差异 需要被分类的场  
1]  
资源而且也不能保证工作的及时性与可靠性 如何  
:  
景类别多达上千种 目前公认的场景分类主要分为 自  
: 2018-02-13;  
; 2018-07-05;  
:
收稿日期  
修回日期  
责任编辑 李勇锋  
国家自然科学基金  
( No. 2017JM6101No. 2017JM6103No. 2017JM6060No. 2017JQ6077 ) ;  
:
( No. 2017YFB1402100) ;  
( No. 11772178No. 61772508No. U1713213) ;  
基金项目 国家重点研发计划  
陕西省自然科学基金  
( No. GK201703060No.  
陕西师范大学中央高校基本科研业务费  
( No. 17JG33)  
年度校级综合教改研究项目  
GK201801004) ;  
2017  
陕西师范大学  
916  
2019  
2]  
, ,  
够计算图像的整体特征 理解场景中的全局信息 并通  
然场景 事件场景 城市场景和室内场景四大类 尽  
管图像场景分类研究已经取得很大的进步 但尚没有  
过图像的能量谱信息提取图像的整体空间布局结构  
但随着图像内容及结构的复杂度不断增加 如分析粒  
一种分类方法能在两类甚至多类图像场景数据库中兼  
具有良好的分类表现 这种矛盾在室内与室外的图像  
度太过粗糙而忽略场景中物体的细节信息 导致分类  
结果远远偏离正确结果 增加了其复杂度和计算负担  
场景分类方法中表现的尤为明显  
2006  
年美国麻省理工学院召开的场景理解研讨  
伴随着研究进展的推进 颜色 光线以及梯度特征  
会上 图像场景分类技术第一次被明确定义为分类的  
在识别过程中表现出的不稳定性 成为当时图像场景  
一个关键课题 自此图像场景分类技术在计算机视觉  
. 2005  
HOG( Histograms of O-  
分类问题的阻碍  
riented Gradients)  
年提出的  
8]  
领域的重要地位基本奠定 每年都不断有大量新方法  
特征 延续了图像局部特征高识别度  
与准确的特点 采用梯度直方图方法有效地解决了光  
和贡献被提出 在早期图像场景分类研究中 大多数方  
线 梯度特征等因素因敏感而引起局部场景轮廓识别  
法是基于特征的 即通过描述颜色 纹理和形状等特征  
来实现分34而后 用融合多种特征的方法来描述  
率低下的问题 然而  
特征维度高 计算效率低 且  
具有很大冗余 没有考虑尺度变换对分类结果产生的  
HOG  
Anna Bosch  
HOG  
不同内容的图像场景 并较先前基于单层次特征的方  
法取得了更好的效果 但由于无法进行深层涵义的理  
影响 为了改进  
特征的不足  
通过使用  
特征并进行融合提  
.  
解 难以胜任复杂场景图像的分类 而基于语义的场景  
HOG  
金字塔模型在图像上分层抽取  
9]  
特征 针对识别不同类别  
PHOG( Pyramid HOG)  
分类法由于层次化模型和分类器的发展得以推  
56然而当场景种类需要被进一步细分时 上述方  
出了  
的场景和不同尺度的图像 研究者们还基于  
HOG  
提出  
法就难以取得理想的分类效果 深度学习的出现则通  
DPM ( Deformable Part-  
了一列改进的模型方法 如  
based Models) 4]  
DPM  
SDPM( Super-  
过大量数据学习到图像的共有深层特征来有效的解决  
和之后基于  
改进的  
vised Object Localization with DPM) 10]  
这种问题  
, ,  
在随后的发展过程中 由于图像复杂度的提高 基  
2
场景分类方法  
HOG  
特征的模型方法出现特征点冗余 计算效率低  
到目前为止 图像场景分类技术的发展主要经历  
. Jianxin Wu 2010 CENTRIST  
等人在 年提出的  
的问题  
11]  
:
了 基于特征 基于语义 基于学习三个阶段  
征 很好地解决了这一不足 该特征通过对获取的像  
2. 1  
基于特征的分类方法  
Census  
, ,  
变换 并将其转化为统计直方图 形成  
素点进行  
CENTRIST  
,  
图像特征如颜色 纹理等是对图像特性的描述 可以  
特征来提取对象局部形状结构 其转化后的  
描述图像的基本信息 也可以反映图像的深层结构信息  
图像依然保留整体和局部结构信息 因此能够模拟人  
下面就一些经典的特征分类方法进行分析与总结  
类视觉系统的实时性 对物体的形状以及纹理等都有  
1999  
David Lowe  
提出的图像局部特征描述算子  
较明确的描述  
( SIFTScale-Invariant Feature Transform) 7]  
由于其在尺  
, ,  
综上所述 四种特征被广泛使用 其优缺点如表  
1
,  
度空间上的缩放 旋转和仿射变换不变性 在室外场景分  
(  
所示 基于特征的场景分类算法通过提取图像特征 如  
类上精度较高 且能够较完整地描述图像的局部特征 当  
) ,  
颜色 形状和纹理等 结合特征描述并设计使用相应  
图像中尺度变化较大时也能准确识别图像的显著特征  
的分类器 在平衡了复杂度以及模型结构后取得了不  
2001  
Aude Oliva  
GIST  
年由  
等人模拟人的视觉提出  
错的场景分类效果  
3]  
特征 以粗略提取图像以及其上下文信息 该特征能  
1
图像特征方法比较  
名称  
类型  
全局  
输出  
优点  
缺点  
适用场合  
特点  
计算复杂度低 简单 背景复杂 目标密集  
3]  
GIST  
光谱信息  
简单的自然场景  
通过光谱表现整体布局  
易用  
场景表现差  
邻域  
适用平移 旋转 尺 复杂场景整体布局 自然场景和简单的 过梯度方向信息表现目标  
7]  
SIFT  
直方图  
度变换  
表现差  
室内场景  
位置信息  
不稳定场景形状结 全 局 结 构 稳 定 的 过像素块边缘梯度表现几  
构表现差 场景 何结构  
8]  
HOG  
局部  
向量  
表现轮廓和边缘  
Census  
Census  
表现局部特性 体现 复 杂 多 变 场 景 表 清晰布局 目标不密 通过  
变换值表现整体  
11]  
CENTRIST  
变换值  
位置信息  
现差  
集场景  
结构  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载