gpt4 book ai didi

ocr - 有没有办法用小字体改进tesseract OCR?

转载 作者:行者123 更新时间:2023-12-04 00:51:08 27 4
gpt4 key购买 nike

我正在尝试通过 python-tesseract 使用 tesseract-OCR 来读取看起来像这样的低分辨率字体:

enter image description here

不幸的是,该图像返回

ZIJZHZI

我认为分辨率太低,这会导致问题。我试过放大图像,并将其裁剪为单个字符,但这些都没有提供太大的改进。还有什么我应该考虑做的,最好是可以使用 Python Imaging Library 完成的事情吗?或者我应该放弃/训练tesseract。

就其值(value)而言,PIL 具有以下内置过滤器:

BLUR, CONTOUR, DETAIL, EDGE_ENHANCE,
EDGE_ENHANCE_MORE, EMBOSS, FIND_EDGES,
SMOOTH, SMOOTH_MORE, and SHARPEN

最佳答案

我试图用以下方法放大图像:

  convert -resize 400% in.bmp out.bmp

然后阅读它:
  tesseract out.bmp res

结果是正确的:
  100

关于ocr - 有没有办法用小字体改进tesseract OCR?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4909396/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com