- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在运行 pytesser 以在 python 中对图像进行 OCR。我第一次从页面上抓取图像时,它很好,但在接下来的几页中准确性变差,直到 87+1 为 $+$
奇怪,嗯?我的猜测是因为 pytesser(来自 tesseract for python 的端口)是为了识别单词而构建的,并将你的 OCR 放入下一个问题的上下文中。所以,没有办法禁用它,我只能将它设置为数字吗?但是 pytesser 没有太多关于它的文档,所以我继续查看 tesseract 常见问题解答,但我并没有真正得到代码。
Use
TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");
BEFORE calling an Init function or put this in a text file called
tessdata/configs/digits
:tessedit_char_whitelist 0123456789
and then your command line becomes:
tesseract image.tif outputbase nobatch digits
Warning: Until the old and new config variables get merged, you must have the nobatch parameter too.
我猜它适用于 C 或 C++。有没有办法在 python 中做到这一点?或者更好的是,禁用 OCR 上下文?
最佳答案
在 python 中:
import tesseract
ocr = tesseract.TessBaseAPI();
ocr.Init(".","eng",tesseract.OEM_TESSERACT_ONLY)
ocr.SetVariable("tessedit_char_whitelist", "0123456789")
你可能还想:
ocr.SetVariable("classify_enable_learning", "0")
ocr.SetVariable("classify_enable_adaptive_matcher", "0")
关于python - 如何仅在 pytesser 中启用数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9466694/
我正在尝试在 python 中实现 OCR。当我运行以下代码时: from PIL import Image from pytesser import * image_file = 'menu.jpg
简单的问题。当我运行 this通过 pytesser 的图像,我得到 $+s。我该如何解决? 编辑 所以...我的代码生成与上面链接的图像相似的图像,只是数字不同,并且应该解决简单的数学问题,如果我能
我已经下载了 PyTesser并将其提取出来。 我在 pytesser_v0.0.1 文件夹中并尝试运行 sample usage python 解释器中的代码: from pytesser impo
我是 python 新手,想安装和使用 pytesser OCR 库。我安装的所有其他模块都使用了 easy_install,效果很好。但 pytesser 是我必须使用 Google Code 的
我已经开始使用 Pytesser,它对英文和中文都很好,但是有没有办法让两种语言同时工作?我必须制作自己的训练数据文件吗?我的代码是: import Image from pytesser impor
我正在使用 PyTesser 来破解 captcha。 PyTesser 使用 tesseract python ocr 库。在将图像放入 PyTesser 之前,我使用了一些过滤。一步一步我的代码:
我正在使用 PyTesser 和 Tesseract 学习 OCR。作为第一个里程碑,我想编写一个工具来识别仅由一些数字组成的验证码。看了一些教程,写了这样一个测试程序。 from pytesser.
我正在运行 pytesser 以在 python 中对图像进行 OCR。我第一次从页面上抓取图像时,它很好,但在接下来的几页中准确性变差,直到 87+1 为 $+$ 奇怪,嗯?我的猜测是因为 pyte
我是 python 的新手,我正在为一个项目使用 pytesser 我已经下载了文件 pytesser_v0.0.1.zip 并且我还安装了 tesseract-ocr。我的疑问是在哪里解压缩 pyt
我正在尝试从屏幕截图中检测一些大写字符。我使用 PIL 将其转换为黑白图像,然后使用 PyTesser 页面中的代码示例,我在图像上运行 tesser.exe: from pytesser impor
我在用 PyTesser从图像中获取文本。它主要工作正常,但在某些情况下我收到此错误: cannot write mode RGBA as BMP 图像没有问题,很好,相同的只是文本不同。 最佳答案
大家好,我是 python 和 OCR 的新手。我正在尝试实现 OCR。我已经安装了 OCR 所需的所有依赖项。同样重要的是我正在使用 Anaconda 自定义提供的 Python。因此,当我尝试导入
我正在尝试将文本图像转换为文本。我在 python 中使用 pytesser 因为我已经安装了 tesseract 但甚至运行以下代码: from pytesser import * im = Ima
我想使用 pytesser OCR,我想在系统中进行相同的更改,以便我可以将其作为模块从系统中的任何位置导入。我尝试使用在 ( Installing pytesser ) 上给出的建议,但它对我不起作
我正在尝试为 osx 10.9(使用 anaconda 作为默认 python)安装这个(还有 pytesser)。我在网上四处张望,但我无法使用任何教程,因为它们似乎都已绝迹(例如,自制软件没有 l
这是我的问题,我想使用 pytesser 来获取图片的内容。我的操作系统是Mac OS 10.11,我已经安装了PIL、pytesser、tesseract-ocr引擎和libpng等其他支持库。但是
首先,我想说我知道 pytesser 不适用于 Python 3.4,但我从 http://ubuntuforums.org/archive/index.php/t-1916011.html 中读到p
我收到此错误:[WinError 2] 系统找不到指定的文件,仅当我使用 pytesser 进行 OCR 时。这是我的代码片段。 from PIL import Image from pytesser
我是一名优秀的程序员,十分优秀!