gpt4 book ai didi

algorithm - 去除 OCR 图像处理中的背景颜色

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:38:35 28 4
gpt4 key购买 nike

我正在尝试删除背景颜色以提高 OCR 对图像的准确性。示例如下所示:

enter image description here

我会保留后处理图像中的所有字母,同时只删除浅紫色带纹理的背景。是否可以使用一些开源软件如Imagemagick将其转换为二进制图像(黑/白)来实现这一目标?如果背景有不止一种颜色怎么办?解决方案是否相同?

另外,如果我也想去掉紫色字母(剧院名称)和线条,只保留黑色字母怎么办?简单裁剪可能不起作用,因为紫色字母也可能出现在其他地方。

我正在寻找编程解决方案,而不是通过 Photoshop 等工具。

最佳答案

您可以使用 GIMP(或任何其他图像编辑工具)执行此操作。

  1. 打开你的图片
  2. 转换为灰度
  3. 复制图层
  4. 使用大内核 (10x10) 将高斯模糊应用到顶层
  5. 计算顶层和底层的图像差异
  6. 对图像进行阈值处理以生成二值图像

模糊图像:

enter image description here

差异图像:

enter image description here

二进制:

enter image description here

如果您一次性使用它,GIMP 可能就足够了。如果您希望多次执行此操作,您可能可以编写一个 imagemagick 脚本或使用 Python 和 OpenCV 等工具编写您的方法。

上述方法的一些问题:

  • 紫色文本 (CENTURY) 丢失了,因为它不像其他文本那样对比强烈。您可以通过对图像的不同部分进行不同的阈值处理或使用局部直方图处理方法来解决这个问题

关于algorithm - 去除 OCR 图像处理中的背景颜色,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5507885/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com