gpt4 book ai didi

imagemagick - 使用ImageMagick和 'textcleaner'清理OCR图像

转载 作者:行者123 更新时间:2023-12-04 06:59:16 33 4
gpt4 key购买 nike

我有以下图像,我想为tesseract的OCR做准备:

目的是清理图像并消除所有噪点。
我正在使用将ImageMagick与以下参数结合使用的 textcleaner 脚本:

./textcleaner -g -e normalize -f 30 -o 12 -s 2 original.jpg output.jpg

输出仍然不是很干净:

我尝试了各种变体的参数,但没有运气。
有人有主意吗?

最佳答案

如果转换为 JPEG ,则总是具有您所看到的工件的类型。

这是JPEG压缩的典型“功能”。 JPEG永远不适合显示锐利线条,在图像的不同区域之间使用统一颜色,仅使用很少几种颜色的对比度的图像。对于黑白文本来说,这是正确的。 JPEG对于典型的照片来说只是“好”,具有许多不同的颜色和阴影。

如果您使用 PNG 作为输出格式,则很可能会完全解决您的问题。下图演示了这一点。我使用与您上次使用的示例命令相同的参数来生成它,但使用PNG作为输出格式:

textcleaner -g -e normalize -f 30 -o 12 -s 2 \
http://i.stack.imgur.com/ficx7.jpg \
out.png

这是对输出的类似缩放:

如果您使用textcleaner脚本的参数,则很有可能会改善输出。但这就是你的工作... :-)

关于imagemagick - 使用ImageMagick和 'textcleaner'清理OCR图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30246756/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com