gpt4 book ai didi

algorithm - 从文档图像中去除噪音

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:49:09 24 4
gpt4 key购买 nike

我正在从事一个自动处理扫描发票的项目。为了获得更好的 OCR 引擎结果,我想首先去除图像中的噪音。除了划痕,我还想删除打印后添加到文档中的所有内容。许多发票,例如被勾选,有时它会使 OCR 无法读取部分发票。

例如看看this图像。第二项的描述将不可读,我想删除这样的“噪音”。

那么我怎样才能去除这样的手写区域,同时仍然保持下面打印文本的高质量呢?

最佳答案

通过忽略任何不至少具有特定颜色强度的像素,可以很容易地过滤掉划痕和其他 Blob 。

处理线条有三种选择:

  1. 第一个重要问题,手写体的颜色是否不同?一个简单的解决办法是给每个人发蓝色或红色的笔,并禁止使用黑色的笔。然后您可以扫描彩色文档,然后您可以轻松地将绿色缓冲区用作灰度图像而不是所有三个缓冲区。这将是最简单的实现方式,现在几乎所有扫描仪都支持彩色扫描。

  2. 否则你将不得不编写一个算法来检测图像中的线条,要使其起作用,您需要先校准算法以首先知道 a 的大小是多少通常是字符,然后找到任何比 X 长的行像素,然后从那里删除线。这将是一个非常有问题的问题,并且对您来说效果不会太好,您将花费很长时间来尝试使其正常工作,但它仍然永远不会 100%。

  3. 另一种方法是,在完成 OCR 之后,您应该出示您的数据给最终用户以验证其正确性,然后您可以出示他们用扫描的图像并允许他们覆盖原来的内容如果不正确,请扫描。

在这三个选项中,我认为您最好的选择就是防止人们用黑笔在发票上书写。如果你做不到,那么尽可能扫描文档并将其提供给最终用户以澄清有问题的字段(你甚至可以将它们标记为有问题,这样用户就不需要检查整个文档时间)。

编辑:值得指出的一件事是,如果您收到的文件是写在上面然后传真过来的,除了选项 3(试试您的最好然后呈现给用户)。

关于algorithm - 从文档图像中去除噪音,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8158182/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com