gpt4 book ai didi

opencv - 用于从扫描文档中提取字段的图像配准算法/技术?

转载 作者:太空宇宙 更新时间:2023-11-03 20:47:14 25 4
gpt4 key购买 nike

enter image description here我正在尝试确定从扫描文档中提取手写数据的最佳方法。

手写数据位于特定的方框区域。我生成了文档的数字版本,因此我知道方框区域的坐标,并且如果需要还可以生成文档的其他变体(即被屏蔽以使字段更容易提取的版本)

我不能仅使用文档生成中的坐标提取字段的原因是在扫描过程中发生了移动/缩放/透视修改,这可以推/拉每个人的坐标框不同(扫描的文档确实有用于对齐的角标记,但即使如此,通常也会发生意外的转换)。

我假设高层有两种方法可以解决这个问题:遍历页面上每个框的坐标并尝试使用某种技术/算法“更正”它们,或者将已完成的表格与空白表格进行比较(屏蔽?)并尝试以这种方式提取正确的字段。

针对这些修改进行调整并准确提取包含手写内容的区域的最有效技术/算法是什么?还有其他选择吗?

最佳答案

有很多可能techniques可以为您的问题实现近 100% 的准确率。

只需按照本页描述的步骤操作 http://www.codeproject.com/Articles/24809/Image-Alignment-Algorithms .简而言之,您首先计算两个图像之间的光流,然后估计产生这种光流的变换。

注意:当匹配的图像几乎相同时,此方法效果最佳。

关于opencv - 用于从扫描文档中提取字段的图像配准算法/技术?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14841161/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com