- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 PyTesser
来破解 captcha
。 PyTesser 使用 tesseract
python ocr 库。在将图像放入 PyTesser 之前,我使用了一些过滤。一步一步我的代码:输入图像是:
from PIL import Image
img = Image.open('1.gif')
img = img.convert("RGBA")
pixdata = img.load()
# Clean the background noise, if color != black, then set to white.
for y in xrange(img.size[1]):
for x in xrange(img.size[0]):
if pixdata[x, y][0] < 90:
pixdata[x, y] = (0, 0, 0, 255)
for y in xrange(img.size[1]):
for x in xrange(img.size[0]):
if pixdata[x, y][2] < 136:
pixdata[x, y] = (0, 0, 0, 255)
for y in xrange(img.size[1]):
for x in xrange(img.size[0]):
if pixdata[x, y][3] > 0:
pixdata[x, y] = (255, 255, 255, 255)
img.save("input-black.gif", "GIF")
应用此代码后输出为:
现在,
im_orig = Image.open('input-black.gif')
big = im_orig.resize((116, 56), Image.NEAREST)
ext = ".tif"
big.save("input-NEAREST" + ext)
在此代码片段之后输出图像为:
最后当我应用它时
from pytesser import *
image = Image.open('input-NEAREST.tif')
print image_to_string(image)
我得到输出 %/ww
请帮我找到正确的结果。
如果我尝试使用这些图像,此代码可以成功识别字母。
最佳答案
在执行验证码识别器之前,您需要执行一些基本的形态学图像操作来删除该行。尝试组合 ndimage.binary_erosion 和 ndimage.binary_dilation。
关于python - 使用 PyTesser 破解简单的验证码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28425336/
我正在尝试在 python 中实现 OCR。当我运行以下代码时: from PIL import Image from pytesser import * image_file = 'menu.jpg
简单的问题。当我运行 this通过 pytesser 的图像,我得到 $+s。我该如何解决? 编辑 所以...我的代码生成与上面链接的图像相似的图像,只是数字不同,并且应该解决简单的数学问题,如果我能
我已经下载了 PyTesser并将其提取出来。 我在 pytesser_v0.0.1 文件夹中并尝试运行 sample usage python 解释器中的代码: from pytesser impo
我是 python 新手,想安装和使用 pytesser OCR 库。我安装的所有其他模块都使用了 easy_install,效果很好。但 pytesser 是我必须使用 Google Code 的
我已经开始使用 Pytesser,它对英文和中文都很好,但是有没有办法让两种语言同时工作?我必须制作自己的训练数据文件吗?我的代码是: import Image from pytesser impor
我正在使用 PyTesser 来破解 captcha。 PyTesser 使用 tesseract python ocr 库。在将图像放入 PyTesser 之前,我使用了一些过滤。一步一步我的代码:
我正在使用 PyTesser 和 Tesseract 学习 OCR。作为第一个里程碑,我想编写一个工具来识别仅由一些数字组成的验证码。看了一些教程,写了这样一个测试程序。 from pytesser.
我正在运行 pytesser 以在 python 中对图像进行 OCR。我第一次从页面上抓取图像时,它很好,但在接下来的几页中准确性变差,直到 87+1 为 $+$ 奇怪,嗯?我的猜测是因为 pyte
我是 python 的新手,我正在为一个项目使用 pytesser 我已经下载了文件 pytesser_v0.0.1.zip 并且我还安装了 tesseract-ocr。我的疑问是在哪里解压缩 pyt
我正在尝试从屏幕截图中检测一些大写字符。我使用 PIL 将其转换为黑白图像,然后使用 PyTesser 页面中的代码示例,我在图像上运行 tesser.exe: from pytesser impor
我在用 PyTesser从图像中获取文本。它主要工作正常,但在某些情况下我收到此错误: cannot write mode RGBA as BMP 图像没有问题,很好,相同的只是文本不同。 最佳答案
大家好,我是 python 和 OCR 的新手。我正在尝试实现 OCR。我已经安装了 OCR 所需的所有依赖项。同样重要的是我正在使用 Anaconda 自定义提供的 Python。因此,当我尝试导入
我正在尝试将文本图像转换为文本。我在 python 中使用 pytesser 因为我已经安装了 tesseract 但甚至运行以下代码: from pytesser import * im = Ima
我想使用 pytesser OCR,我想在系统中进行相同的更改,以便我可以将其作为模块从系统中的任何位置导入。我尝试使用在 ( Installing pytesser ) 上给出的建议,但它对我不起作
我正在尝试为 osx 10.9(使用 anaconda 作为默认 python)安装这个(还有 pytesser)。我在网上四处张望,但我无法使用任何教程,因为它们似乎都已绝迹(例如,自制软件没有 l
这是我的问题,我想使用 pytesser 来获取图片的内容。我的操作系统是Mac OS 10.11,我已经安装了PIL、pytesser、tesseract-ocr引擎和libpng等其他支持库。但是
首先,我想说我知道 pytesser 不适用于 Python 3.4,但我从 http://ubuntuforums.org/archive/index.php/t-1916011.html 中读到p
我收到此错误:[WinError 2] 系统找不到指定的文件,仅当我使用 pytesser 进行 OCR 时。这是我的代码片段。 from PIL import Image from pytesser
我是一名优秀的程序员,十分优秀!