gpt4 book ai didi

c# - 如何自定义 Tesseract 忽略噪音?

转载 作者:太空狗 更新时间:2023-10-30 00:42:23 25 4
gpt4 key购买 nike

我有一张这样的图片(白色背景和黑色文字)。如果没有噪音(如您所见:数字行的顶部和底部有很多噪音),Tesseract 可以很好地识别数字。

但是当有噪音时,Tesseract 会尝试将其识别为数字并将更多数字添加到结果中。这真的很糟糕。如何让 Tesseract 忽略噪音?我无法制作预处理图像以使其更具对比度或更清晰的文本。这没有任何帮助。

如果某些工具只能突出显示字符串行。它可以是 Tesseract 的非常好的输入。请帮我。谢谢大家。

enter image description here

最佳答案

你应该试试 eroding and dilating :

The most basic morphological operations are two: Erosion and Dilation. They have a wide array of uses, i.e. :

Removing noise

...

关于c# - 如何自定义 Tesseract 忽略噪音?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15862715/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com