gpt4 book ai didi

ocr - 为什么我在 Tesseract 中收到 "tiff page 1 not found"Lebtonica 警告?

转载 作者:行者123 更新时间:2023-12-03 20:59:33 26 4
gpt4 key购买 nike

我刚开始使用 Tesseract .

我正在遵循 here 中描述的说明.

我创建了一个这样的测试图像:

training/text2image --text=test.txt --outputbase=eng.Arial.exp0 --font='Arial' --fonts_dir=/usr/share/fonts

现在我想训练 Tesseract 如下:
tesseract eng.Arial.exp0.tif eng.Arial.exp0 box.train

这是我的输出:
Tesseract Open Source OCR Engine v3.04.00 with Leptonica
Page 1
APPLY_BOXES:
Boxes read from boxfile: 112
Found 112 good blobs.
Generated training data for 21 words
Warning in pixReadMemTiff: tiff page 1 not found

这会阻止创建 fontfile.tr文件。我尝试通过忽略警告来继续,但是在创建字符集时,我得到了一个很棒的内容:
unicharset_extractor lang.fontname.exp0.box

"58
NULL 0 NULL 0
Joined 0 0,255,0,255,0,0,0,0,0,0 NULL 0 0 0 # Joined [4a 6f 69 6e 65 64 ]
|Broken|0|1 0 0,255,0,255,0,0,0,0,0,0 NULL 0 0 0 # Broken
T 0 0,255,0,255,0,0,0,0,0,0 NULL 0 0 0 # T [54 ]
h 0 0,255,0,255,0,0,0,0,0,0 NULL 0 0 0 # h [68 ]
e 0 0,255,0,255,0,0,0,0,0,0 NULL 0 0 0 # e [65 ]
( 0 0,255,0,255,0,0,0,0,0,0 NULL 0 0 0 # ( [28 ]
q 0 0,255,0,255,0,0,0,0,0,0 NULL 0 0 0 # q [71 ]
u 0 0,255,0,255,0,0,0,0,0,0 NULL 0 0 0 # u [75 ]
..."

这是我正在使用的版本:
tesseract 3.04.00
leptonica-1.72
libjpeg 8d (libjpeg-turbo 1.3.0) : libpng 1.2.50 : libtiff 4.0.3 : zlib 1.2.8

知道为什么会这样吗?

最佳答案

这可能是一个错误,我正在使用 v4.00.00alpha 并且我得到

Tesseract Open Source OCR Engine v4.00.00alpha with Leptonica
Page 1
APPLY_BOXES:
Boxes read from boxfile: 100
Found 100 good blobs.
Generated training data for 21 words

关于ocr - 为什么我在 Tesseract 中收到 "tiff page 1 not found"Lebtonica 警告?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33279374/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com