gpt4 book ai didi

python - Tesseract 选项和图像预处理

转载 作者:行者123 更新时间:2023-12-05 08:51:55 26 4
gpt4 key购买 nike

The image I try to OCR

Edit : As asked, here is the original image

亲爱的社区我正在尝试做一些 ocr。
我已经对图像进行了很多预处理(歪斜、裁剪……)
现在,我可以毫无问题地自己读取数字了
但我无法让 tesseract 给我一个有意义的结果。

单击顶部的链接可以查看我正在尝试进行 OCR 的图像

我还缺少更多预处理吗?
还是我对 tesseract 的调用很糟糕?

我试过没有任何选择,或者有:

config = ('--psm 13 -c tessedit_char_whitelist=0123456789')

编辑:

有趣的是,我尝试了多种方法:

  • Windows 上的 Tesseract 5,不提供任何'eT'(但可能不好配置)
  • 来自 Windows 上 Phyton Jupyter Notebook 的 Google API => 'UO01124' 之类的不太记得了
  • buntu 上的 Tesseract 4 配置 = ('-l eng --oem 1 --psm 13') : 'WU000 244m'
  • 来自 Python Jpyter Notebook on Ubuntu 的 Google API => 'U000241\n'

所以这对我来说是最开始的。我可能更喜欢使用 Tesseract,以免花大价钱。当我的项目更高级时,我会知道我能做什么。

但我很想听听您对图像预处理的建议!! :-)

所以如果你有建议。

问候!

最佳答案

您可以为 tesseract 提供三个重要的标志,它们是 -l--oem--psm

  • -l 标志控制输入文本的语言。

  • --oem 参数或 OCR 引擎模式控制 Tesseract 使用的算法类型。

  • --psm 控制 Tesseract 使用的自动页面分割模式。

获取选项使用:

像这样使用这些选项 config = ("-l eng --oem 1 --psm 7")

关于python - Tesseract 选项和图像预处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58148626/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com