python - Tesseract - 将多个单词图像格式化为 OCR 图像的最佳方式-6ren

python - Tesseract - 将多个单词图像格式化为 OCR 图像的最佳方式

转载作者：太空宇宙更新时间：2023-11-04 04:15:42

我有一系列图片，每张图片都包含一个词。我不想在所有图像上分别运行 pytesseract OCR(效果很好)，而是想将图像编译成一个大图像并在其上运行 pytesseract OCR(以降低运行时间)。

格式化图像以获得最佳效果的最佳方式是什么？ (即:它们是否应该水平、垂直、困惑等排列)

另外，最好的页面分割模式是什么？

我已经尝试水平连接图像，然后使用 PSM 7(将图像视为单行文本)，但是，这并没有产生与使用 PSM 8(将图像处理为单行文本)对每个单独的单词图像运行 pytesseract OCR图像作为一个词)。

最佳答案

pytesseract 正在包装 tesseract 可执行文件，因此它 wrote each image to disk还有read output from disk .每次启动 tesseract 可执行文件都会导致 api 初始化(例如，从磁盘读取训练数据)。

如果您对大型文本/图像进行 OCR，这可能不是什么大问题，但如果您有大量短文本图像(例如 word)，那就是浪费时间/性能。考虑通过 cffi 或 ctype 在 python 中使用 tesseract C-API。参见 recent example in tesseract user forum .

关于python - Tesseract - 将多个单词图像格式化为 OCR 图像的最佳方式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55485018/

文章推荐： linux - 如何将硬件中断连接到 Qt Emit？

文章推荐： javascript - 手动 slider 不应在透明区域可见

文章推荐：无法在 C 中打印出字符串

文章推荐： python - 非 root 执行命令

perl - 是否可以在 perl 中将子例程原型(prototype)化为 $$&？
出于好奇，我尝试了一些原型(prototype)制作，但似乎只允许在第一个位置使用子例程的原型(prototype) &。当我写作时 sub test (&$$) { do_somethin
android - 将 ViewPager fragment 化为 Play 商店应用程序？
我需要开发一个类似于 Android Play 商店应用程序或类似 this app 的应用程序.我阅读了很多教程，发现几乎每个教程都有与 this one 类似的例子。 . 我已经开始使用我的应用程
sql - 在 Teradata 中达到阈值后，将一列数字 session 化为 30 组
考虑一个表示“事件之间的时间”的列: (5, 40, 3, 6, 0, 9, 0, 4, 5, 18, 2, 4, 3, 2) 我想将这些分组到 30 个桶中，但桶会重置。期望的结果: (0, 1,

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - Tesseract - 将多个单词图像格式化为 OCR 图像的最佳方式