gpt4 book ai didi

python - 无法使用openCV从图像中提取每个文本

转载 作者:行者123 更新时间:2023-12-02 16:33:57 25 4
gpt4 key购买 nike

我正在尝试使用 openCV 和 Pytesseract 从图像中读取文本,但似乎我无法读取该图像中写入的所有内容,无论是纯文本还是 Logo 上的内容。

我做了这样的事情: -

img = cv2.imread(image_path)
bw_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow('B/W Image', bw_img)
cv2.waitKey(0)
print(pytesseract.image_to_string(bw_img, lang='eng'))
cv2.destroyAllWindows()

以及我作为输出得到的返回:-

支持本地企业并捐赠给
‘COVID-19 危机应对基金
弗里大埃文斯维尔地区

支持

本地的

我附上了我试图从中读取文本的图像,您可以看到矩形按钮 Logo 内的文本“ORDER HERE”无法通过 openCV 读取/提取。

enter image description here

在下图中,Cloud Vision API 和 Pytesseract 都无法从中提取正确的文本。对于图像第一,我得到“俱乐部价格”和第二个“”。
enter image description here
enter image description here

如果有任何其他方式在 python 中读取文本比这个更好或更容易,请分享。

最佳答案

Tesseract 似乎不太喜欢白色文本。如果我对你的最后两张图片运行它,这就是我得到的

import cv2
import pytesseract

img = cv2.imread('599.jpg', 0)
# img = 255 - img #invert image
print(pytesseract.image_to_string(img, lang='eng', config = '--psm 12'))

print('====================================================')

img = cv2.imread('25off.jpg', 0)
# img = 255 - img #invert image
print(pytesseract.image_to_string(img, lang='eng', config = '--psm 12'))

输出:
so

“I

99
====================================================
vs

25

off

(OP om ilo)

不是一场彻底的灾难,但也不是很大。现在,如果您取消注释 img = 255 - img行,您将反转图像,输出变为:
5

I)

99
====================================================
%

25

off

Club Price

这要好得多。

关于python - 无法使用openCV从图像中提取每个文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61478332/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com