gpt4 book ai didi

python - 烦人的 python tesseract 错误 Error opening data file ./tessdata/eng.traineddata

转载 作者:太空狗 更新时间:2023-10-30 02:45:26 27 4
gpt4 key购买 nike

我遇到了这个错误,这个错误让我对 tesseract 的 python 包装器感到有点疯狂,这是一个名为 tesseract 的 python 模块。

这是我尝试运行的 python 代码:

img = cv2.imread(image, 0)
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetPageSegMode(tesseract.PSM_AUTO)
tesseract.SetCvImage(img,api)
url = api.GetUTF8Text()
conf=api.MeanTextConf()
print('Extracted URL : ' + url)
api.End()

这就是我得到的:

Error opening data file ./tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!

我不明白为什么要这样做,因为我已将 TESSDATA_PREFIX 环境变量正确设置为我的 tesseract 安装的正确路径(带有尾部斜杠)。

当我尝试直接从 powershell 运行 Tesseract 时(顺便说一下,我在 Windows 7 上),方法是:

 tesseract.exe .\data\test.tif -psm 7 out

它就像一个魅力!此外,当我在我的 python 脚本中使用 Popen 调用 Tesseract 时,它工作正常,但我不喜欢我无法直接从 stdout 获取 OCR 文本的想法。事实上,除了为 Tesseract 提供输出文件名然后打开并从该文件中读取之外,似乎别无选择。我觉得处理临时文本文件只是为了获得 OCR 的输出会非常糟糕......

帮助?

最佳答案

api.Init 的第一个参数应该是 TESSDATA_PREFIX。

关于python - 烦人的 python tesseract 错误 Error opening data file ./tessdata/eng.traineddata,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24672531/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com