gpt4 book ai didi

tesseract - 遇到问题训练 tesseract

转载 作者:行者123 更新时间:2023-12-02 04:47:07 27 4
gpt4 key购买 nike

我是 tesseract 的新手,对 github 页面中的不同目录有点困惑。

tesserac-ocr 代码库是我安装的。在/usr/local/share/tessdata/中安装了一个 tessdata 目录

所以现在在训练 tesseract 时我运行以下命令 -

# tesseract img.tif img box.train

我得到以下错误

Tesseract Open Source OCR Engine v3.03 with Leptonica
Error opening data file /usr/local/share/tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

显然找不到 tessdata 文件夹。

所以现在我从 github ( https://github.com/tesseract-ocr/tessdata ) 获得了 tessdata 目录。然后将 TESSDATA_PREFIX 指向从 github 下载的 tessdata。不改变任何东西。我收到以下错误 -

Tesseract Open Source OCR Engine v3.03 with Leptonica
read_params_file: Can't open box.train

所以我的问题是tessdata应该指向什么? tesseract从哪里获取训练命令中的box.train?

最佳答案

作为新手,您可以做的最愚蠢的事情之一就是尝试训练 tesseract ;-)

下一步:3.03 版本不在官方 github.com 存储库中(顺便说一句:3.03 从未正式发布...只是 Ubuntu 发布了该版本。)

下一步:如果您正确安装了 tesseract(从源代码),则安装了 box.train。你是从 Ubuntu packages/repo 安装的(我不这么认为,因为在那种情况下 tesseract 不会使用/usr/local/... )而不是你应该联系 packager 如何打包 tesseract。

关于tesseract - 遇到问题训练 tesseract,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32030815/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com