gpt4 book ai didi

python - 为什么 tesseract 无法从这个简单的图像中读取文本?

转载 作者:行者123 更新时间:2023-12-03 22:44:21 25 4
gpt4 key购买 nike

我已经阅读了大量关于 pytesseract 的帖子,但我无法让它从一个死的简单图像中读取文本;它返回一个空字符串。

这是图像:

TestImage

我试过缩放它,灰度化,调整对比度,阈值化,模糊化,它在其他帖子中所说的一切,但我的问题是我不知道 OCR 想要更好地工作。它想要模糊的文字吗?高对比度?

要尝试的代码:

import pytesseract
from PIL import Image

print pytesseract.image_to_string(Image.open(IMAGE FILE))

正如您在我的代码中看到的,图像存储在我的计算机本地,因此 Image.open()

最佳答案

尝试一些类似的东西

import pytesseract 
from PIL import Image
import requests
import io

response = requests.get('/image/J2ojU.png')
img = Image.open(io.BytesIO(response.content))
text = pytesseract.image_to_string(img, lang='eng', config='--psm 7')

print(text)
--psm等于或大于 6 的值对我来说确实产生了“Gm”。
如果图像存储在本地(以及您的工作目录中),只需删除 response变量并更改 text 的定义用线条
image_name = "J2ojU.png" # or whatever appropriate
text = pytesseract.image_to_string(Image.open(image_name), lang='eng', config='--psm 7')

关于python - 为什么 tesseract 无法从这个简单的图像中读取文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54261255/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com