gpt4 book ai didi

python - 使用 pytesser 识别简单数字

转载 作者:行者123 更新时间:2023-11-28 18:42:43 25 4
gpt4 key购买 nike

我正在使用 PyTesserTesseract 学习 OCR。作为第一个里程碑,我想编写一个工具来识别仅由一些数字组成的验证码。看了一些教程,写了这样一个测试程序。

from pytesser.pytesser import *
from PIL import Image, ImageFilter, ImageEnhance

im = Image.open("test.tiff")
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
text = image_to_string(im)
print "text={}".format(text)

我用下图测试了我的代码。但结果是 2(T?770。我也测试了一些其他类似的图像,在 80% 的情况下结果不正确。

enter image description here

我对图像处理不熟悉。我在这里有两个问题:

  1. 是否可以告诉 PyTesser 只猜测数字?

  2. 我认为这张图片很容易让人阅读。如果 PyTesser 读取纯数字图像如此困难,是否有任何替代方案可以实现更好的 OCR?

非常感谢任何提示。

最佳答案

我认为您的代码还不错。它可以识别207770。问题出在 pytesser 安装上。 pytesser 中的 Tesseract 已过时。您将下载最新版本并覆盖相应的文件。您还需要编辑 pytesser.py 并更改

tesseract_exe_name = 'tesseract'

import os.path
tesseract_exe_name = os.path.join(os.path.dirname(__file__), 'tesseract')

关于python - 使用 pytesser 识别简单数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24247813/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com