gpt4 book ai didi

c++ - Tesseract OCR 无法正确训练图像

转载 作者:塔克拉玛干 更新时间:2023-11-03 07:48:02 25 4
gpt4 key购买 nike

我在训练 Tesseract OCR 时遇到以下问题。我正在为 Windows 使用 Tesseract 3.02。

我有一个要训练的字符数据集。我编写了一个 C++ 程序来读取数据集中的每个字符,将其裁剪并调整为 40x40 图像,然后合并/粘贴到大小为 650x450 的单个图像上(见附图)。对数据集中的所有 100 张图像重复此操作。 C++ 程序还为每个添加的字符生成框文件。我已经使用 Tesseract wiki 上提到的 Box 编辑器工具验证了 box 文件和图像。这些文件是正确的。合并图像的扩展名为.tif。

我附上图片供您引用。问题是当我在 Tesseract 中训练图像时,我在控制台上得到以下输出。

F:\test>tesseract eng.normal.exp0.tif eng.normal.exp0 box.trainTesseract 开源 OCR 引擎 v3.02 与 Leptonica申请箱: 从 boxfile 中读取的框:100 找到 100 个好的 blob。培训...字体名称=正常生成9个词的训练数据

即使图像中有 36 个不同的单词或字符,Tesseract 表示它只能生成 9 个字符的训练数据。它还说它找到了 100 个好的 blob。我不知道为什么会出现这个问题。盒子文件包含图像中所有 100 个字符的标签。

请帮忙!

training image

谢谢

最佳答案

根据training guide,训练数据集应该是真实的.请注意,正如您所提到的,它生成了 9 个单词而不是 9 个字符的训练数据。可能它可能已经识别了所有字符。您可以使用 this tool检查生成的 .traineddata 文件以分析 tesseract 已针对哪些字符进行训练。

关于c++ - Tesseract OCR 无法正确训练图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34507248/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com