推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

一种联合文本和图像信息的行人检测方法

更新时间:2019-12-24 00:48:46 大小:1M 上传用户:zhiyao6查看TA发布的资源 标签:行人检测 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

针对纯视觉行人检测方法存在的误检、漏检率高,遮挡目标以及小尺度目标检测精度低等问题,提出一种联合文本和图像信息的行人检测方法.该方法首先利用图像分析的方法初步获取图像目标的候选框,其次通过文本分析的方法获取文本中有关图像目标的实体表达,并提出一种基于马尔科夫随机场的模型用于推断图像候选框与文本实体表达之间的共指关系(Coreference Relation),以此达到联合图像和文本信息以辅助机器视觉提高交通场景下行人检测精度的目的.在增加了图像文本描述的加州理工大学行人检测数据集上进行的测评结果表明,该方法不仅可以在图像信息的基础上联合文本信息提高交通场景中的行人检测精度,也能在文本信息的基础上联合图像信息提高文本中的指代消解(Anaphora Resolution)精度.


部分文件列表

文件名 大小
一种联合文本和图像信息的行人检测方法.pdf 1M

部分页面预览

(完整内容请下载后查看)
1
Vol. 45 No. 1  
Jan. 2017  
2017  
1
ACTA ELECTRONICA SINICA  
一种合文本和图像信息的方法  
12  
12  
3
12  
12  
, , , ,  
炫余 娟 卢 邵 鹏 飞  
( 1.  
大学国家重点实验室 汉  
430072; 2.  
大学计算机汉  
430072;  
3.  
大学电与信息  
410082)  
:
, ,  
方法在的遮挡标检精度低问题 提出一  
,  
合文本和图像信息的方法 该方法首先用图像方法初步获图像目候选文本  
方法文本中有图像目的实表达 提出一种基于的模型用于图像候选文  
( Coreference Relation) ,  
图像和文本信息机器提高通场景下行  
表达之共指系  
,  
精度的目的 在图像文本描述理工大学进行明 该方法不可以  
在图像信息的基础合文本信息提高通场中的精度 能在文本信息的基础图像信息提高文  
( Anaphora Resolution)  
精度  
中的解  
:
;
;
-
;
;
关键词  
中图分类号  
URL: http: / /www. ejournal. org. cn  
文本 图像信息共指解  
TP391 0372-2112 ( 2017) 01-0140-07  
DOI: 10. 3969 /j. issn. 0372-2112. 2017. 01. 020  
:
:
A
:
文章编号  
文献标识码  
电子学报  
A Method for Pedestrian Detection by  
Combining Textual and Visual Information  
12  
12  
3
12  
12  
ZHOU Xuan-yu LIU Juan LU Xiao SHAO Peng LUO Fei  
( 1. State Key Lab of Software EngineeringWuhan UniversityWuhanHubei 430072China;  
2. Computer SchoolWuhan UniversityWahanHubei 430072China;  
3. College of Electrical and Information EngineeringHunan UniversityChangshaHunan 410082China)  
Abstract: Existing vision-based pedestrian detection methods encounter many flawssuch as high false and miss de-  
tection rateslow detection accuracy on partial occluded and small scale objectsetc. In this paperwe propose a pedestrian  
detection method combining textual and visual information together. Firstwe use a vision-based method to initially localize  
the candidate visual objects. Secondwe analyze the text information to get the text mentions corresponding to the visual ob-  
jects. Finallywe propose a Markov random field-based model to infer the coreference relations between the candidate visual  
objects and textual mentionsso that the visual and textual information can be fused efficiently. The experimental results on  
the Caltech pedestrian detection benchmark enriched with textual description information have shown that the proposed meth-  
od can not only improve the pedestrian detection accuracy by combining textual information with visual informationbut also  
outperform the baseline anaphora resolution model by combining visual information with textual information.  
Key words: pedestrian detection; Markov random field; text and image information combination; coreference rela-  
tion; anaphora resolution  
3]  
4]  
特征 设分类器  
多视图  
1
引言  
5]  
姿态检测问题的研究  
以提高该方法精度  
智能的重研究容 也算机  
, ,  
复杂环境通  
1]  
的研究点  
统的方法基  
遮挡的现智能无法对当  
2]  
制  
并通挖掘描述力  
; , (  
环境正确算法对低  
: 2015-12-10;  
: 2016-05-26;  
:
责任编辑 李勇锋  
收稿日期  
修回日期  
:
基金项目 国家自然科学基金  
( No. 61272274) ;  
( No. 61402340) ;  
( No. 2014CFB194)  
自然科学基金  
国家自然科学基金年项目  
141  
1
:
一种合文本和图像信息的方法  
) ,  
辨率 标检精度低 以致车无法及时准  
;
邻两个表达之势函框表示  
,  
上述两个问题 研究者们提出了相  
文本表达与图像目共指信息 φ 表  
ac  
67]  
应的方法  
但这方法只是为决  
文本图像目共指势函数  
测问题 并没考虑通场难  
8]  
信息的基础的信息以提  
精度成为研究的随着语音和人  
互水提高 机器系统智  
复杂环境成为了可人  
或者被遮挡处理方法有  
可以描述示  
, : ,  
智能辆汽深色方  
.  
两个行他们穿描述可  
9]  
机器丰富的信息  
智能好  
环境  
文本信息与图像信息正确 骤  
( Mention)  
是找出文本有的实表达  
图像中的目  
共指正确出文本所  
有的目对文本有的实表达进行代  
( Anaphora resolution) .  
2. 1  
文本分析  
( Entity)  
体  
2. 1. 1  
文本预处理  
、 、  
文本处理主要词 词识  
年中 合文  
解  
10]  
.  
处理的模精度以数  
本和图像信息的研究主要中在图像检索 自然语  
1112]  
的一性 文本处理基础自然预  
成  
景 和图像分  
算法景  
研究自然机器  
*
13]  
9]  
处理技术自然言处理小组供  
2. 1. 2  
本文通场中的文本表达分为语  
别  
文本描述智能实现  
和代式  
一目的 提出了一种合文本和图像信息的科  
: ,  
描述多个行人和单  
模型用于提高通场精度 该  
3]  
能有文本文本表达  
HOG-SVM  
方法首先通过  
候选场  
模型合文本信息图像信息候选进行推  
算法初步获通场所  
.  
图像中的目齐 因引入抽  
NNNPNR  
取所有的树上的  
15]  
候选中的识  
.  
其是为行人 方法图像描述文本的  
14]  
.  
得到句  
Caltech  
据库 进行广泛的果  
依赖关可以各类属  
提出方法性经典行  
, : 、 、 ( ) ;  
特征 两个行  
方法提高 模型能有效地利用  
( ) ; ( ) ;  
深色颜色和  
图像目和文本中实表达共指推  
( )  
等  
出文本表达之系 在所标描  
:
图像描  
文本信息能有提高消  
, ,  
描述图像的文本使用  
模型的精度  
( )  
一定或者文  
2
文本和图像法  
现的解  
16]  
Soon  
本文基于  
提出实现一种经  
合文本和图像信息 将找出文本中  
的实表达与图像中的目共指系的问题视  
( MRF)  
的中模型 模型可以得到实  
表达之率  
问题 模型分  
模型  
2. 2  
(
文本信息ψ  
)
( ) ,  
图像信息ψ 模型中变量  
rgb  
图像分析  
text  
, ,  
通场往往它们  
1 ,  
系如图 所示 框表图像信息 φ 示  
c
图像目的一势函φ 图像目的  
cc  
; ,  
势函数 蓝框表文本信息 φ 文  
aa  
*
http: / /nlp. stanford. edu/software/  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载