gpt4 book ai didi

c++ - 提高特定任务的 tesseract 性能

转载 作者:太空宇宙 更新时间:2023-11-03 22:59:55 24 4
gpt4 key购买 nike

我已经阅读了 this 的答案问题。

我有一系列包含 3-10 个字符的单词的图像。它们是在计算机本身上创建的图像,因此图像质量一致且图像上没有任何噪点。字体非常大(大约 30 像素高)。这对于 tesseract 来说已经很容易准确读取了,但是我可以使用哪些技术来提高速度,即使只是提高几毫秒?

字符集仅包含大写字母。由于本例中的 OCR 任务非常具体,如果我用这种特定的字体和字体大小训练 tesseract 引擎会有帮助还是太过分了?

编辑以包含样本

除了 tesseract 之外,是否还有其他可以提供更好性能的 C/C++ 解决方案?使用 OpenCV 可以更快地完成吗?与 Linux 兼容者优先。

示例

enter image description here

enter image description here

enter image description here

enter image description here

enter image description here

最佳答案

如果所有字母的大小和样式都相同,您可以尝试一些非常简单的操作,例如运行 Blob 检测,然后对单个字母进行模板匹配。我不确定它与 tesseract 相比如何,但这是一个非常简单的实验。 (此外,降低分辨率会加快速度......)你也可以看看这个问题:Simple Digit Recognition OCR in OpenCV-Python , 可能是相关的

关于c++ - 提高特定任务的 tesseract 性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20898398/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com