gpt4 book ai didi

python - cv2直接tesseract不保存

转载 作者:行者123 更新时间:2023-12-03 20:54:08 24 4
gpt4 key购买 nike

import pytesseract
from pdf2image import convert_from_path, convert_from_bytes
import cv2,numpy
def pil_to_cv2(image):
open_cv_image = numpy.array(image)
return open_cv_image[:, :, ::-1].copy()


path='OriginalsFile.pdf'
images = convert_from_path(path)
cv_h=[pil_to_cv2(i) for i in images]
img_header = cv_h[0][:160,:]
#print(pytesseract.image_to_string(Image.open('test.png'))) I only found this in tesseract docs

您好,有没有办法阅读 img_header直接使用pytesseract而不保存,

pytesseract docs

最佳答案

pytesseract.image_to_string() 输入格式

正如文档解释的那样 pytesseract.image_to_string()需要一个 PIL 图像作为输入。
因此,您可以轻松地将您的 CV 图像转换为 PIL one,如下所示:

from PIL import Image
... (your code)
print(pytesseract.image_to_string(Image.fromarray(img_header)))

如果你真的不想使用 PIL!

看:
https://github.com/madmaze/pytesseract/blob/master/src/pytesseract.py

pytesseract 是一个简单的包装器来运行 tesseract 命令 def run_and_get_output()行,您会看到它将您的图像保存到一个临时文件中,然后将地址提供给 tesseract 以运行。

因此,您可以对 opencv 执行相同操作,只需重写 pytesseract .py文件用opencv来做,虽然;我没有看到任何性能改进。

关于python - cv2直接tesseract不保存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61462432/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com