gpt4 book ai didi

ocr - 如何使 tesseract 在存在噪声的情况下给出相关结果?

转载 作者:行者123 更新时间:2023-12-04 13:49:43 26 4
gpt4 key购买 nike

我正在使用 tesseract 3.0.0,我遇到了以下问题:

当某物太小以至于 tesseract 无法识别时,它似乎与其他片段。因此,不会返回任何相关内容。

下图显示了 3 个案例。只有带有虚线的矩形被传递给 tesseract。矩形上方是结果(V over T 表示换行)。

最后一个案例是有问题的。在这种情况下有什么办法可以改进 tesseract 吗?

enter image description here

最佳答案

据我所知,Tesseract 还没有适当的图像分割(或文档分析,因为它在商业 OCR 应用程序中被称为。)通常,在 OCR 完成之前,图像会在包含文本的单独区域上分割,图片、条码、线条等。然后,您仅将 OCR 应用于文本区域,而不会遇到您刚才描述的问题。

Tesseract 的早​​期版本根本没有该功能,并且 Tesseract 应该仅用作行识别器,或所谓的字段级识别器,当您将它用于从大图像剪切的小文本片段时。

我没有完全遵循 3.0 中引入的内容,可能它已经部分存在,但显然它没有按预期工作,正如您刚刚发现的那样。

还有另一个开源项目 - OCRopus,它完全按照我的描述解决了这个问题 - 首先是 Document Analisys(又名 Segmentation),然后才是 OCR。他们的早期版本实际上是在分析步骤完成后使用 Tesseract 进行 OCR。但后来他们引入了自己的 OCR(仍然不是很好)并将 Tesseract 插件支持移到了优先级列表中。

以下是您实际可以采取的措施来解决您的问题:

  • 如果您的图像具有非常典型的结构,您可以尝试进行一些愚蠢的分割并在将图像传递给 Tesseract 之前自己从图像中剪切文本。但是,如果您希望支持各种各样的图像,那就算了。
  • 您可以检查 OCRopus 并查看它们的分割是否适用于您的图像。如果是,那么您可以花一些时间让 OCRopus + Tesseract 协同工作。
  • 好吧,如果您所做的不仅仅是为了好玩而且您珍惜自己的时间,我建议您考虑像 ABBYY 这样的真正的 OCR 引擎。您将获得开箱即用的分割和 OCR 的更高准确性,当然还有专业的客户支持。

免责声明:我为 ABBYY 工作

关于ocr - 如何使 tesseract 在存在噪声的情况下给出相关结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4945148/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com