推荐星级:
- 1
- 2
- 3
- 4
- 5
数字视频中文字的检测提取技术的
资料介绍
作为一种高级语义特征,视频中的文字信息对视频内容的理解、索引和检索具有重要意义。本文针对非压缩域中视频文字的检测与提取技术做了详尽的分析和讨论,涉及的内容包括:
文字事件的检测、帧图像中文字区域的检测与分割以及视频文字识别(Video OCR)等。对于不同的典型算法,分析了其理论基础和应用特点,并且通过对比指出其不足和应用的局限。最后,本文还展望了该技术未来发展的方向。
视频流中的文字可分成两大类:一种是场景本身包含的文字,称为场景文字;另一种是后期制作中加入的文字,称为人工文字。场景文字由于其出现的位置、大小、颜色和形态的随机性,难于检测和提取。人工文字出现的字体较规范、颜色为单色、大小有一定的限度,而且它通常起到对视频片断的内容进行说明总结的作用,因此容易检测和提取并适合用来做视频的索引和检索。本文将主要讨论后者的检测与提取技术。图1 给出两种不同视频文字的示例。
部分文件列表
文件名 | 大小 |
数字视频中文字的检测提取技术的.pdf | 98K |
全部评论(0)