gpt4 book ai didi

ocr - 无法在tesseract中打开印地语语言的Cube语言模型参数

转载 作者:行者123 更新时间:2023-12-01 03:35:18 25 4
gpt4 key购买 nike

Tesseract 无法读取多维数据集语言模型。tesseract 1.png output.txt -l hin执行上述命令后出现以下错误。

Cube ERROR (CubeRecoContext::Load): unable to read cube language model params from /usr/share/tesseract-ocr/tessdata/hin.cube.lm
Cube ERROR (CubeRecoContext::Create): unable to init CubeRecoContext object
init_cube_objects(false, &tessdata_manager):Error:Assert failed:in file tessedit.cpp, line 207
Segmentation fault

我在哪里 hin.cube.lm 文件以及如何处理该文件?

最佳答案

我通过安装以下文件的正确版本来修复此错误:

  • hin.cube.bigrams
  • hin.cube.fold
  • hin.cube.lm
  • hin.cube.nn
  • hin.cube.params
  • hin.cube.word-freq
  • hin.tesseract_cube.nn

  • 以及正确版本的印地语和英语训练数据。

    以上所有文件均可在以下位置获得:
    https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-304305

    我把这些文件放在:/usr/local/share/tessdata

    这是在 CentOS 7.2 上

    关于ocr - 无法在tesseract中打开印地语语言的Cube语言模型参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35403070/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com