gpt4 book ai didi

ubuntu - 如何将 osd、equ.traineddata 和其他经过训练的数据文件(孟加拉语、印地语)与 pytesseract 一起使用(命令以及 eq.traineddata 的放置位置)

转载 作者:行者123 更新时间:2023-12-04 18:59:53 29 4
gpt4 key购买 nike

我希望 tesseract 引擎使用 eq.traineddata研究一些数学以及孟加拉语、印地语文本。当我去 /usr/share/tesseract-ocr/4.00/tessdata ,我只看到一堆*.traineddata文件。检查official documentation ,我找到了这些数据文件的链接。我已经下载了osd.traineddata以及 tessdata link 中给出的所有其他文件在 github。
现在我该怎么办??我必须将这些文件放在哪里,然后哪个命令将启用这些语言?
我正在使用 Ubuntu 18Conda环境。

最佳答案

您可以将 *.traineddata 文件复制到/usr/share/tesseract-ocr/4.00/tessdata。在运行 tesseract 期间,您可以使用 -l 参数传递训练数据。
例如)tesseract 输入路径输出 -l osd

关于ubuntu - 如何将 osd、equ.traineddata 和其他经过训练的数据文件(孟加拉语、印地语)与 pytesseract 一起使用(命令以及 eq.traineddata 的放置位置),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63669870/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com