gpt4 book ai didi

python - 使用 PyTesser 破解简单的验证码

转载 作者:行者123 更新时间:2023-11-28 19:19:42 25 4
gpt4 key购买 nike

我正在使用 PyTesser 来破解 captcha。 PyTesser 使用 tesseract python ocr 库。在将图像放入 PyTesser 之前,我使用了一些过滤。一步一步我的代码:输入图像是:input image

from PIL import Image
img = Image.open('1.gif')
img = img.convert("RGBA")
pixdata = img.load()
# Clean the background noise, if color != black, then set to white.
for y in xrange(img.size[1]):
for x in xrange(img.size[0]):
if pixdata[x, y][0] < 90:
pixdata[x, y] = (0, 0, 0, 255)

for y in xrange(img.size[1]):
for x in xrange(img.size[0]):
if pixdata[x, y][2] < 136:
pixdata[x, y] = (0, 0, 0, 255)

for y in xrange(img.size[1]):
for x in xrange(img.size[0]):
if pixdata[x, y][3] > 0:
pixdata[x, y] = (255, 255, 255, 255)


img.save("input-black.gif", "GIF")

应用此代码后输出为:

现在,

im_orig = Image.open('input-black.gif')
big = im_orig.resize((116, 56), Image.NEAREST)

ext = ".tif"
big.save("input-NEAREST" + ext)

在此代码片段之后输出图像为:

enter image description here

最后当我应用它时

from pytesser import *
image = Image.open('input-NEAREST.tif')
print image_to_string(image)

我得到输出 %/ww

请帮我找到正确的结果。

如果我尝试使用这些图像,此代码可以成功识别字母。

enter image description here enter image description here

最佳答案

在执行验证码识别器之前,您需要执行一些基本的形态学图像操作来删除该行。尝试组合 ndimage.binary_erosion 和 ndimage.binary_dilation。

关于python - 使用 PyTesser 破解简单的验证码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28425336/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com