gpt4 book ai didi

python - 如何在python中使用OCR从Image中获取文本识别器的坐标

转载 作者:行者123 更新时间:2023-12-03 20:20:29 28 4
gpt4 key购买 nike

我正在尝试使用 Tesseract 从图像中获取文本字符的坐标或位置。
我想知道确切的像素位置,以便我可以使用其他工具单击该文本。

编辑 :

import pytesseract
from pytesseract import pytesseract
import PIL
from PIL import Image
import cv2
import csv

img = 'E:\\OCR-DATA\\sample.jpg'
imge = Image.open(img)
data=pytesseract.image_to_string(imge,lang='eng',boxes=True,config='hocr')

print(data)
data包含具有框边界值的识别文本。但我不确定,如何使用该边界值来获取文本的坐标。
data的值(value)变量如下:
O 100 356 115 373 0

u 117 356 127 368 0

t 130 356 138 372 0

p 141 351 152 368 0

u 154 356 164 368 0

t 167 356 175 371 0

最佳答案

你可以试试这个:

img = 'tes.jpg'
imge = Image.open(img)
data=pytesseract.image_to_boxes(imge)

print(data)

这将直接为您提供结果如:
T 22 58 52 97 0
H 62 58 95 96 0
R 102 58 135 97 0
E 146 57 174 97 0
A 184 57 216 96 0
D 225 56 258 96 0

关于python - 如何在python中使用OCR从Image中获取文本识别器的坐标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48928592/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com