gpt4 book ai didi

python - Tesseract OCR 数字分类结果不佳

转载 作者:太空宇宙 更新时间:2023-11-03 21:44:52 24 4
gpt4 key购买 nike

我正在处理图像分类任务,我正在使用 Tesseract OCR 进行数字分类。

我的主要问题是从单个数字的 OCR 接收到的结果非常差。

在网上阅读了很多关于提高 Tesseract 性能的内容后,我使用以下通用方案使用 OpenCV 预处理图像:

  1. 寻找轮廓
  2. 边界框
  3. 裁剪到方框以获得个位数
  4. 阈值化得到二值图像
  5. 通过添加白色背景填充图像
  6. 模糊。

我得到了一些我相当满意的东西,例如:

我通过以下方式调用 Tesseract,强调我期望的是单个数字:

tesseract input.jpg output.txt - psm 10 digits

我以为 Tesseract 肯定会正确识别它,但它返回“.”。

有没有人有进一步改进的想法?我猜我可以针对这种特定字体训练 Tesseract,但由于我要处理不同的字体,我希望有更好的方法。

最佳答案

什么版本的 Tesseract?它对我有用(注意:“-”和“psm”之间不应有空格)。

$ tesseract ~/Downloads/6digit.jpg stdout -psm 10 digits
6

$ tesseract -v
tesseract 3.05.00dev
leptonica-1.71
libgif 4.2.3 : libjpeg 9a : libpng 1.6.21 : libtiff 4.0.6 : zlib 1.2.8 : libwebp 0.5.0 : libopenjp2 2.1.0

关于python - Tesseract OCR 数字分类结果不佳,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35130793/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com