gpt4 book ai didi

image-processing - OCR 处理前的图像预处理

转载 作者:行者123 更新时间:2023-12-04 08:33:12 25 4
gpt4 key购买 nike

我目前的项目涉及将 pdf 中的文本转录成文本文件,我首先尝试将图像文件直接放入 OCR 程序(tesseract),但效果不佳。原始图像文件基本上是旧报纸,并且有一些背景噪音,我确信 tesseract 有问题。因此,我尝试在将其输入 tesseract 之前使用一些图像预处理。有没有适合这种情况的开源图像预处理引擎的建议???以及如何使用它的说明将更加感激!

最佳答案

我从未听说过为此目的的“图像预处理引擎”,但您可以查看 OpenCV (开源计算机视觉库)并实现您自己的“预处理引擎”。 OpenCV 是一个计算机视觉库,它提供了许多功能来执行图像处理。

您可能希望作为预处理步骤进行测试的一件有趣的事情是对图像应用阈值以去除噪音和其他东西。无论如何,我已经在 this thread 中讨论过这类东西。

关于image-processing - OCR 处理前的图像预处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15558537/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com