gpt4 book ai didi

python - 表单处理 - 检测框以分隔部分

转载 作者:行者123 更新时间:2023-12-02 17:28:07 25 4
gpt4 key购买 nike

我正在开发一个桌面应用程序,它将采用手写形式(一个示例是 here ),从中读取数字,并将它们输入到 csv 文件中。

我正在使用模板匹配算法来定位每个标题并返回坐标,然后我使用这些坐标沿 y 轴切掉相关 block ,以便我的程序稍后可以读取它。我遇到的问题是如何告诉算法何时停止裁剪。

我需要帮助的地方:我设计的表格在每个部分周围都有黑框。理论是,模板在表单上定位后,我将有一个函数接收模板所在位置的坐标(即“日期”列在 255,322,465,462),然后找到最近的最底角(黑框)到该部分并返回坐标。

我对图像处理及其行话真的很陌生,所以我希望得到一些关于如何执行这个理论的建议,例如可能有助于该过程的 opencv 函数、类似项目的示例、我可能需要谷歌搜索哪些术语更多信息(这种类型的图像处理是否有特定名称?)等。

最佳答案

Opencv python 中有 Connected Components 功能,您将在其中获取每个单独的框,稍后您可以过滤掉您需要的框。
下面是示例代码

img = cv2.imread('form.jpg', 0)
img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)[1] # ensure binary
ret, labels = cv2.connectedComponents(img)

您可以指定参数连接来检查 4 路或 8 路(默认)连接。不同的是,4路连接只检查顶部、底部、左侧和右侧像素,看它们是否连接; 8路检查八个相邻像素中的任何一个是否连接

关于python - 表单处理 - 检测框以分隔部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57773057/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com