- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在定义一个将图像转换为灰度(位黑白色)的函数,然后将其传递给:
text = pytesseract.image_to_string(Image.open(gray_scale_image))
然后我打印我收到的文本,但它抛出错误:
Traceback (most recent call last):
File "C:\Users\HP\PycharmProjects\nayaproject\venv\lib\site-packages\PIL\Image.py", line 2613, in open
fp.seek(0)
AttributeError: 'numpy.ndarray' object has no attribute 'seek'
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "C:/Users/HP/PycharmProjects/nayaproject/new.py", line 17, in <module>
text = pytesseract.image_to_string(Image.open(g))
File "C:\Users\HP\PycharmProjects\nayaproject\venv\lib\site-packages\PIL\Image.py", line 2615, in open
fp = io.BytesIO(fp.read())
AttributeError: 'numpy.ndarray' object has no attribute 'read'
而不是 Image.open(grayscale),当我使用 Image.fromarray(grayscale) 时,我得到了这些错误:
Traceback (most recent call last):
File "C:\Users\HP\PycharmProjects\nayaproject\venv\lib\site-packages\pytesseract\pytesseract.py", line 170, in run_tesseract
proc = subprocess.Popen(cmd_args, **subprocess_args())
File "C:\Users\HP\AppData\Local\Programs\Python\Python36\lib\subprocess.py", line 709, in __init__
restore_signals, start_new_session)
File "C:\Users\HP\AppData\Local\Programs\Python\Python36\lib\subprocess.py", line 997, in _execute_child
startupinfo)
FileNotFoundError: [WinError 2] The system cannot find the file specified
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "C:/Users/HP/PycharmProjects/nayaproject/new.py", line 17, in <module>
text = pytesseract.image_to_string(Image.fromarray(g))
File "C:\Users\HP\PycharmProjects\nayaproject\venv\lib\site-packages\pytesseract\pytesseract.py", line 294, in image_to_string
return run_and_get_output(*args)
File "C:\Users\HP\PycharmProjects\nayaproject\venv\lib\site-packages\pytesseract\pytesseract.py", line 202, in run_and_get_output
run_tesseract(**kwargs)
File "C:\Users\HP\PycharmProjects\nayaproject\venv\lib\site-packages\pytesseract\pytesseract.py", line 172, in run_tesseract
raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
我正在使用 PyCharm,我已经为这个项目安装了 Pillow、numpy、opencv-python、pip 和 pytesseract。
最佳答案
因为我猜想 gray_scale_image 是从 OpenCV 输出的,因此是错误提示的 numpy 数组
AttributeError: 'numpy.ndarray' 对象没有属性 'read'
您需要将数组转换为 PIL 对象。根据我自己的经验,我建议您自动将 numpy 数组转换为 np.uint8,因为 PIL 使用 8 位并且您通常不了解 OpenCV 算法的内容。
text = pytesseract.image_to_string(Image.fromarray(gray_scale_image.astype(np.uint8)))
如果上面提到的不起作用,你绝对不要传递任何形式的图像数组。尝试键入这些以查找参数的字符:
print(type(gray_scale_image))
print(gray_scale_image.shape)
在这将解决您的第一个问题之后,将会出现您还不知道的新问题。您需要将路径添加到您的 pytesseract
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
解决办法是在开头加上你的路径
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
TESSDATA_PREFIX = 'C:/Program Files (x86)/Tesseract-OCR'
关于python - 我可以让 pytesseract 命令在抛出错误的 pycharm 中正常工作吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53745080/
尝试将简单的测试图像打印到文本时出现以下错误。 我已经验证我具有Pillow(PIL 1.1.7),并尝试卸载并重新安装pytesseract。文件路径是正确的,因为如果更改它们,则会收到另一个错误消
我正在尝试阅读此图像中还包含小数点和小数的文本 这样: img = cv2.imread(path_to_image) print(pytesseract.image_to_string(img))
我想识别这样的图像: 我正在使用以下配置: config="--psm 6 --oem 3 -c tessedit_char_whitelist=0123456789ABCDEFGHIJKLMNOPQ
我正在尝试通过 opencv 和 pytesseract 运行一个简单的车牌图像来获取文本,但我无法从中获取任何内容。按照这里的教程: https://circuitdigest.com/microc
我有使用 pytesseract 的代码并且工作完美,只有当我尝试识别的图像是 0 到 9 时才不起作用。如果图像只有一位数字,则不会给出任何结果。 这是我正在工作的图像样本 https://driv
我有这张 table 的图片 我正在尝试使用 PyTesseract 解析它。我已经非常接近使用此代码: from PIL import Image, ImageOps import pytesser
我有这个图像是从另一个图像裁剪而来的,我想将此图像作为image_to_string方法的输入: import pytesseract import cv2 num_plate = cv2.imrea
我正在尝试从图像中提取文本,但是pytesseract提供了完全不同的输出,输出下方附加的图像是“Werle”(完整的单词和字符),我尝试了许多不同的处理方法,例如图像增强,rgb2gray,rgb2
这是噪声图像扫描的经典PyTesseract问题。但是,在这种情况下,点矩阵打印机正在文本中打印一些水平的白线。随附一些样本。我不确定哪种预处理将改善文本的扫描。 使用以下命令,以下示例将输出以下内容
我在使用 Pytesser 使用此代码进行测试时遇到了一些问题: from PIL import Image import pytesseract img = Image.open('pic.png'
尝试在 python 上运行 tesseract,这是我的代码: import cv2 import os import numpy as np import matplotlib.pyplot as
我的代码: pytesseract.pytesseract.tesseract_cmd = 'C:/Programs/tesseract' print(pytesseract.image_to_str
我将 MSS 与 pytesseract 结合使用,尝试在屏幕上阅读以确定来自被监视区域的字符串。我的代码如下: import Image import pytesseract import cv2
以下代码在我 friend 的 windows 笔记本电脑上运行完美,但在我的笔记本电脑上,它吐出完全垃圾。我认为这可能与图书馆有关,但我不能肯定地说?你们能告诉我它是否适合您,或者您以前是否遇到过这
我在 Python 中使用以下代码从图像中提取文本, import cv2 import numpy as np import pytesseract from PIL import Image #
我是 pyhton 的新手,我正在使用 haar 级联制作车牌识别系统。我的代码可以很好地检测车牌并制作轮廓,但 pytesseract ocr 无法识别字符并给出奇怪的结果。请帮忙。 The det
我目前遇到 pytesseract 的问题,软件无法在此图像中检测到数字: /image/kmH2R.png 这是从应用了阈值过滤器的更大图像中获取的。 出于某种原因,pytesseract 不想识别
Pytesseract 无法识别数字 6 和 8。它识别 6 作为5 和 5 作为 5, 3 作为 8 和 8 作为 8, Oct 为 0c: 或 0:: 和 Wed 作为 Men。 使用的脚本: c
我有非常高分辨率的工程图/电路图,其中包含许多不同区域的文本。目的是从此类图像中提取文本。 我正在使用 pytesseract 来完成此任务。直接应用 pytesseract 是不可能的,因为在这种情
我目前面临 pytesseract 的问题,该软件无法检测到此图像中的数字: 出于某种原因,pytesseract 不想识别该图像中的数字。有什么建议么?这是我的代码: import pytesser
我是一名优秀的程序员,十分优秀!