推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于python平台开发扫描电子书生成目录

更新时间:2025-01-20 11:53:51 大小:1M 上传用户:mulanhk查看TA发布的资源 标签:python 下载积分:9分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

一、工具准备

python

1.pycharm

2.ttf文字库

3.PaddleOCR(第三方包)

4.Freepic2pdf

二、操作过程

利用Freepic2pdf生成书签

image.png

image.png

会生成一个同名文件夹,是存储书签的txt文件的。

image.png

开始是空的。

利用pycharm编写ocr识别文件和合并目录和页码的py

ocr识别目录,页码


image.png


image.png放到代码文件的同目录下

image.png

运行ocr.py

image.png

生成目录页的txt文件

运行页码.py

生成页码.txt

对目录的txt文件进行排查错误

每行可能出现的识别错误,如:各别出现的.,或者是7.1与对应内容不在一行

image.png要删除空格让他们在同一行


再利用合并目录页.py实现目录识别结果和页码的合并


把合并的txt文件的内容复制到Freepic2pdf的书签txt中


挂载pdf书签

image.png

最终的效果

image.png


未完待续:准备把这些程序做成一个exe文件,尽量简化操作,不依赖pycharm开发软件。


部分文件列表

文件名大小
OCR识别目录挂载书签/
OCR识别目录挂载书签/.idea/
OCR识别目录挂载书签/.idea/.gitignore
OCR识别目录挂载书签/.idea/.name
OCR识别目录挂载书签/.idea/encodings.xml
OCR识别目录挂载书签/.idea/inspectionProfiles/
OCR识别目录挂载书签/.idea/inspectionProfiles/profiles_settings.xml
OCR识别目录挂载书签/.idea/misc.xml
OCR识别目录挂载书签/.idea/modules.xml
OCR识别目录挂载书签/.idea/OCR_detect.iml
OCR识别目录挂载书签/.idea/workspace.xml9KB
...

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载