gpt4 book ai didi

tesseract - 使用 Tesseract 检测黑色背景上的白色字符

转载 作者:行者123 更新时间:2023-12-04 07:34:21 108 4
gpt4 key购买 nike

我对 Tesseract OCR 完全陌生。这个问题可能很简单,但我似乎无法使用 Google 找到答案。

基本上,我有一个包含两部分的图像:第一部分位于图像的顶部,黑色背景和白色文本;第二部分位于图像的底部,具有白色背景和黑色文本。

我在图像上运行了 tesseract,它正确识别了底部的所有字符,但没有识别出顶部的所有字符。我相信顶部的字符非常清晰,应该很容易被 Tesseract 识别。唯一的区别是它有黑色背景。

有没有办法使用 Tesseract 同时识别黑白背景中的文本?

最佳答案

T. Kasar、J. Kumar 和 A. G. Ramakrishnan 的一篇论文描述了该问题的一种解决方案:“字体和背景颜色无关的文本二值化”。该论文可在 here 中找到. Jason Funk 有一个算法的实现。他的实现可以在here中找到.
我在算法上取得了一些成功。我认为这种类型的解决方案正是您正在寻找的。

您可能还会发现查看最近提出的有关背景去除的问题 ( OpenCV for OCR: How to compute thresholding levels for gray image OCR ) 及其答案会很有帮助。您可以通过背景颜色分离感兴趣的区域,然后将每个区域交给 tesseract 进行处理。或者,在二值化后,您可以反转图像黑色背景部分中的 8x8 像素区域(在上面的答案中描述)(或反之亦然)以创建统一的背景。

最后,通过搜索车牌识别问题(或车牌)的解决方案,您可能会找到一些有用的信息。许多车牌(车牌)都有可能干扰识别的背景图像或照明伪影。更普遍的问题是背景去除。

关于tesseract - 使用 Tesseract 检测黑色背景上的白色字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39002966/

108 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com