gpt4 book ai didi

python - 由于使用 PyTesseract 的背景颜色,无法从屏幕截图中读取文本

转载 作者:行者123 更新时间:2023-12-01 06:36:33 26 4
gpt4 key购买 nike

我正在尝试使用 pytesseract 从计算机/移动屏幕截图中提取和检测文本。它工作正常,但在某些情况下,像这样,未检测到按钮文本可能是由于绿色背景。

原始图像

Original Image

文本检测后的图像

Detected Text

这是我正在使用的代码:

d = pytesseract.image_to_data(img, output_type=Output.DICT)# img is an numpy nd array, i.e image read using OpenCV
n_boxes = len(d['level'])
for i in range(n_boxes):
# eliminating blank characters
if d['text'][i].strip() == '': continue
else: print(d['text'][i])
(x,y,w,h) = (d['left'][i], d['top'][i], d['width'][i], d['height'][i])
cv2.rectangle(img, (x,y), (x+w, y+h), (0, 255, 0), 2)

plot_image(img)

最佳答案

尝试对图像进行二值化,使其变为黑白。二值化/图像阈值处理是此类用例的常用图像处理方法。

这些链接可能会有所帮助。

1. ImageThresholding-Opencv

2. Adaptive Thresholding

3. Text Binarization

关于python - 由于使用 PyTesseract 的背景颜色,无法从屏幕截图中读取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59640275/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com