- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试从屏幕截图中检测一些大写字符。我使用 PIL 将其转换为黑白图像,然后使用 PyTesser 页面中的代码示例,我在图像上运行 tesser.exe:
from pytesser import *
image = Image.open('fnord.tif')
print image_to_string(image)
我正在使用这张图片:
但它无法将其识别为 E,或者与此相关的任何其他内容。我认为这是一个足够干净的捕捉?顶部的噪音并没有把它扔掉,对吧?
有什么我想念的吗?
最佳答案
如果您担心噪点是否是个问题,请在 MSPaint 或类似软件中手动打开图像,去除噪点,然后通过 OCR 运行新图像。这是了解 OCR 引擎的工作原理以及混淆和不混淆的最佳方式。每个 OCR 引擎的工作方式都不同。
在这种情况下,可能是微小的噪音也混淆了字符分区过程。您应该检查从 OCR 引擎返回的边界框值,以查看 OCR 引擎是否正在寻找您的单词或字符的正确位置。
某些 OCR 引擎具有在 OCR 过程中去除图像噪声的选项。这通常称为去 Blob 或噪声去除。可以使用 Leptonica ( http://www.leptonica.org ) 去除噪声,它现在是最新的 Tesseract 图像的一部分。
屏幕字体对 OCR 引擎提出了巨大挑战,因为 DPI 通常很低。对于您的“E”,应该有足够多的像素可以识别。沉重的冲程重量可能会混淆引擎。
此外,商业引擎通常比 Tesseract 更准确,但也会带来昂贵的许可费用。
关于python - pytesser 成功率低?这是噪音问题,还是需要做其他事情?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11923615/
我正在尝试在 python 中实现 OCR。当我运行以下代码时: from PIL import Image from pytesser import * image_file = 'menu.jpg
简单的问题。当我运行 this通过 pytesser 的图像,我得到 $+s。我该如何解决? 编辑 所以...我的代码生成与上面链接的图像相似的图像,只是数字不同,并且应该解决简单的数学问题,如果我能
我已经下载了 PyTesser并将其提取出来。 我在 pytesser_v0.0.1 文件夹中并尝试运行 sample usage python 解释器中的代码: from pytesser impo
我是 python 新手,想安装和使用 pytesser OCR 库。我安装的所有其他模块都使用了 easy_install,效果很好。但 pytesser 是我必须使用 Google Code 的
我已经开始使用 Pytesser,它对英文和中文都很好,但是有没有办法让两种语言同时工作?我必须制作自己的训练数据文件吗?我的代码是: import Image from pytesser impor
我正在使用 PyTesser 来破解 captcha。 PyTesser 使用 tesseract python ocr 库。在将图像放入 PyTesser 之前,我使用了一些过滤。一步一步我的代码:
我正在使用 PyTesser 和 Tesseract 学习 OCR。作为第一个里程碑,我想编写一个工具来识别仅由一些数字组成的验证码。看了一些教程,写了这样一个测试程序。 from pytesser.
我正在运行 pytesser 以在 python 中对图像进行 OCR。我第一次从页面上抓取图像时,它很好,但在接下来的几页中准确性变差,直到 87+1 为 $+$ 奇怪,嗯?我的猜测是因为 pyte
我是 python 的新手,我正在为一个项目使用 pytesser 我已经下载了文件 pytesser_v0.0.1.zip 并且我还安装了 tesseract-ocr。我的疑问是在哪里解压缩 pyt
我正在尝试从屏幕截图中检测一些大写字符。我使用 PIL 将其转换为黑白图像,然后使用 PyTesser 页面中的代码示例,我在图像上运行 tesser.exe: from pytesser impor
我在用 PyTesser从图像中获取文本。它主要工作正常,但在某些情况下我收到此错误: cannot write mode RGBA as BMP 图像没有问题,很好,相同的只是文本不同。 最佳答案
大家好,我是 python 和 OCR 的新手。我正在尝试实现 OCR。我已经安装了 OCR 所需的所有依赖项。同样重要的是我正在使用 Anaconda 自定义提供的 Python。因此,当我尝试导入
我正在尝试将文本图像转换为文本。我在 python 中使用 pytesser 因为我已经安装了 tesseract 但甚至运行以下代码: from pytesser import * im = Ima
我想使用 pytesser OCR,我想在系统中进行相同的更改,以便我可以将其作为模块从系统中的任何位置导入。我尝试使用在 ( Installing pytesser ) 上给出的建议,但它对我不起作
我正在尝试为 osx 10.9(使用 anaconda 作为默认 python)安装这个(还有 pytesser)。我在网上四处张望,但我无法使用任何教程,因为它们似乎都已绝迹(例如,自制软件没有 l
这是我的问题,我想使用 pytesser 来获取图片的内容。我的操作系统是Mac OS 10.11,我已经安装了PIL、pytesser、tesseract-ocr引擎和libpng等其他支持库。但是
首先,我想说我知道 pytesser 不适用于 Python 3.4,但我从 http://ubuntuforums.org/archive/index.php/t-1916011.html 中读到p
我收到此错误:[WinError 2] 系统找不到指定的文件,仅当我使用 pytesser 进行 OCR 时。这是我的代码片段。 from PIL import Image from pytesser
我是一名优秀的程序员,十分优秀!