gpt4 book ai didi

python-3.x - pytesseract image_to_string 不拉字符串,但没有错误

转载 作者:行者123 更新时间:2023-12-05 08:54:26 31 4
gpt4 key购买 nike

我正在使用 pytesseract 包中的 image_to_string 函数将单个图片文件的多个部分转换为字符串。除此图像外,所有部分均正常工作:

enter image description here

这是我用来转换它的脚本:

from PIL import Image
import pytesseract
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

im = Image.open('image.png')
text = pytesseract.image_to_string(im)
print(text)

给出输出:

—\—\—\N—\—\—\—\—\N

我尝试将图像分解成更小的部分,并将图像处理为 jpg 和 png。我该怎么做才能让它输出图像中的值?

最佳答案

使用不同的页面分段而不是默认的页面分段似乎可行。

text = pytesseract.image_to_string(im,config ='--psm 6'))

根据 tesseract wiki,选项 6 假定单个统一文本 block 。我尝试了其他选项,但只有这个有效。要检查其他页面分割方法,请阅读关于如何提高图像质量的 tesseract wiki。

关于python-3.x - pytesseract image_to_string 不拉字符串,但没有错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50048616/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com