gpt4 book ai didi

c++ - 进行 OCR 前的预处理(tesseract、OpenCV)

转载 作者:搜寻专家 更新时间:2023-10-31 02:23:14 54 4
gpt4 key购买 nike

为了使用 OCR 库 tesseract 获得更好的结果,我会进行一些预处理,但还不知道哪些步骤可以帮助我。

enter image description here enter image description here

我已尝试使用因子 15 调整图像大小并应用自适应阈值(参见图像),但这会导致“波浪”字符,无法使用 tesseract OCR 库检测到。在底部,您可以通过 Dropbox 找到我的图片链接。原图尺寸为115x18px,字符高度为10px。

我想从背景中提取字符。哪些步骤可以带来更好的结果?我应该为 OCR 部分使用另一个 OCR 库而不是 tesseract 吗?在使用tesseract 进行文本检测时,您一般有哪些经验?还是您更喜欢其他图书馆或商业图书馆?

Dropbox Link to example image

19.6.15 更新:

Original Image OTSU Thresholded image

OTSU 阈值作为自适应阈值可提供更好的结果。将在接下来的几天提供有关其他答案的更新!

更新 01.07.2015还有另一个示例图像,其中应该使用 tesseract 识别序列号。由于字体很小,识别结果不是很好。知道什么样的方法可以帮助解决这个问题吗?

Another example image

最佳答案

Otsu 阈值在这里给了我更好的结果。结合距离变换和另一个阈值,我什至得到了 tesseract 几乎可以识别的东西。

enter image description here

这是我得到的结果:

6ANFK9PC)100'0-GT

关于c++ - 进行 OCR 前的预处理(tesseract、OpenCV),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29533664/

54 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com