gpt4 book ai didi

ocr - Tesseract OCR - 手写字体

转载 作者:行者123 更新时间:2023-12-05 03:15:54 37 4
gpt4 key购买 nike

我正在尝试使用 Tesseract-OCR检测其中包含纯文本的图像文本,但这些文本具有名为Journal 的手写字体。

例子:

enter image description here

结果不是最好的:

Maxima! size` W (35)

有没有可能改进结果或者更确切地说得到准确的结果?

最佳答案

我很惊讶 Tesseract 做得这么好。通过一些培训,您应该能够正确识别小写字母“l”。

您遇到的主要问题是大 T 字符的顶部。水平线延伸穿过 2 个(可能是 3 个)其他字符单元格,这会导致任何 OCR 引擎在尝试分割字符以进行识别时出现问题。在这种情况下,培训可能会有所帮助。

下一个问题是 .和 :它们非常轻/薄,甚至可能在 OCR 开始之前通过图像预处理被移除。

总体而言,使用 Tesseract 改进结果的唯一机会是调查培训。以下是一些可能有帮助的链接。

Alternative to Tesseract OCR Training?
Tesseract OCR Library learning font
Tesseract confuses two numbers

关于ocr - Tesseract OCR - 手写字体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8735105/

37 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com