gpt4 book ai didi

python - Tesseract - 将多个单词图像格式化为 OCR 图像的最佳方式

转载 作者:太空宇宙 更新时间:2023-11-04 04:15:42 27 4
gpt4 key购买 nike

我有一系列图片,每张图片都包含一个词。我不想在所有图像上分别运行 pytesseract OCR(效果很好),而是想将图像编译成一个大图像并在其上运行 pytesseract OCR(以降低运行时间)。

格式化图像以获得最佳效果的最佳方式是什么? (即:它们是否应该水平、垂直、困惑等排列)

另外,最好的页面分割模式是什么?

我已经尝试水平连接图像,然后使用 PSM 7(将图像视为单行文本),但是,这并没有产生与使用 PSM 8(将图像处理为单行文本)对每个单独的单词图像运行 pytesseract OCR图像作为一个词)。

最佳答案

pytesseract 正在包装 tesseract 可执行文件,因此它 wrote each image to disk还有read output from disk .每次启动 tesseract 可执行文件都会导致 api 初始化(例如,从磁盘读取训练数据)。

如果您对大型文本/图像进行 OCR,这可能不是什么大问题,但如果您有大量短文本图像(例如 word),那就是浪费时间/性能。考虑通过 cffi 或 ctype 在 python 中使用 tesseract C-API。参见 recent example in tesseract user forum .

关于python - Tesseract - 将多个单词图像格式化为 OCR 图像的最佳方式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55485018/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com