gpt4 book ai didi

python-tesseract - 训练 Tesseract 来标记图标

转载 作者:行者123 更新时间:2023-12-02 03:09:38 28 4
gpt4 key购买 nike

我正在尝试为 Tesseract 4.0 创建训练数据来识别屏幕截图中的图标(例如,评论,分享,保存)。这是示例屏幕截图:
sample screenshot

我想微调 Tesseract 以实现如下输出:
喜欢147
评论 29
已保存 5
行动
58
行动
个人资料访问 24
已关注 2

我已按照 https://pretius.com/how-to-prepare-training-files-for-tesseract-ocr-and-improve-characters-recognition/ 中所述逐步进行操作

我修改了box文件如下:
- 心:喜欢
- 语音气泡:评论
- 书签:已保存
- 箭头:分享

但是,最终的训练数据未能按照我想要的方式读取图标。我遇到的错误示例是“Like is not in unicharset”。在为图标创建 unicharset 时我必须做一些不同的事情吗?

最佳答案

我已经弄清楚了。框编辑器需要单个字母/数字而不是完整的单词。我使用 Unicode 字符来解释我的图标。步骤如下:

  1. 裁剪您希望 Tesseract 检测的所有目标图标,并将其保存在一个名为(在我的例子中)own.std.exp0.png 的文件中
  2. 使用命令“tesseract own.std.exp0.png own.std.exp0 makebox”创建 box 文件
  3. 打开jTessBoxEditor并在char列输入unicode。支持的 unicode 列表可以在程序字符映射 ( https://sites.psu.edu/symbolcodes/windows/charmap/ ) 下找到。示例:对于心形符号,我使用 U+2665。请注意,不支持某些 unicode。它显示为空白方 block 。所以,继续尝试,直到找到一个有效的方法。我最终编辑的盒子文件如下所示。
    edited box file
  4. 创建最终的训练文件,即 own.trainneddata(可以按照此处所示 https://medium.com/apegroup-texts/training-tesseract-for-labels-receipts-and-such-690f452e8f79 完成或使用 jTessBoxEditor 进行训练)。
  5. 将 own.traineddata 复制到目录 Tesseract/tessdata 并使用 lang='own+eng' 运行 Tesseract。我使用了 pytesseract ,输出如下:
    tesseract output

关于python-tesseract - 训练 Tesseract 来标记图标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57995023/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com