gpt4 book ai didi

ocr - 将 tesseract 训练为一种特定字体

转载 作者:行者123 更新时间:2023-12-04 15:51:01 25 4
gpt4 key购买 nike

我正在使用 tesseract 对屏幕上的 OCR 文本-刮刀应用。
唯一使用的字体是 Segoe UI 8 CLEARTYPE QUALITY(见下图)。
目前tesseract做得很差,混合了Z和2,0和o等等。
我试图放大文本图像(没有改进)。查看 eng.traineddata 我可以看到 tesseract 没有使用 Segoe UI 8 CLEARTYPE QUALITY 进行训练。
问题 :如何使用新字体训练 tesseract 并指定仅应使用该字体?
enter image description here

最佳答案

请提供您努力的一个例子 .我的目标是帮助您实现目标,而不是为您完成工作。

这是一个相当普遍的问题,很多人已经解决了这个问题,有些人比其他人更有效。您可以使用他们创建的工具。

一个例子

  • 代码:https://github.com/ValYouW/ml-ocr-tool
  • 视频教程:https://www.youtube.com/watch?v=7uc05vyjVuw&t=631s
    ocr

  • 还有很多其他的,其中一些只做字体并为此进行了优化。这可能是对你更有影响力的事情。例如:
  • https://www.youtube.com/watch?v=i_1-hGsXxy8
    enter image description here

  • 还有其他的例子,但大部分都是使用image magic等工具来提高初始输入数据的质量,让OCR工具发挥最大的作用。就我个人而言,在运行 Tesseract 之前,我编写了高效的 c# GDI 转换来操作输入数据。

    关于ocr - 将 tesseract 训练为一种特定字体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49238221/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com