python - 如何在此图像中定位特定的表单域

转载作者：太空宇宙更新时间：2023-11-03 23:13:25

24

4

在巴西，为医院里的每个新生儿填写(手工)的标准表格。此表格称为“DNV”(以葡萄牙语“Born Alive Declaration”命名)。还有一种称为“DO”的表格(在葡萄牙语中是“死亡声明”的意思)。在我所在的州，医院向我工作的机构发送了将近一百万份这样的表格，我们在那里计算一个名为“生命统计”的数据库。我正在调查是否有可能使工作自动化。由于商业 ICR 解决方案需要花费大量资金，因此没有负责人相信它可以在内部完成，因此它是一个草根项目。

表格的顶部是这样的:

我接触到从几家医院发送的 100K PDF 文件，并能够使用一种朴素的算法将它们分类为两种类型(DNV 或 DO)中的一种:首先，我找到包含文档类型的黑色矩形(使用 cv2.findContours 和一些启发式方法)并应用 OCR (pytesseract.image_to_string)。我找到了 20k 的“死亡声明”(DO) 和 80k 的“born alive declaration”。

使用类似的算法，我能够对黑色矩形右侧的数字进行 OCR，并将 55k 表格图像与专业打字员根据这些文档填写的数据库中的相应记录链接起来。

现在我想找到日期字段(红色)，以便尝试一些机器学习来识别数字 - 该字段在下面突出显示:

首先我尝试了一个“模板匹配”算法，使用这个作为模板:

这很有效，但前提是模板和表单图像的比例和角度相同。 cv2.matchTemplate 方法对比例非常敏感。我尝试了使用 SURF 的特征匹配算法，但我很难让它发挥作用(感觉有点矫枉过正)。

因为很容易找到左边的黑色矩形，我正在考虑一些选项来定位数字:

基于黑色矩形标准化比例和角度并尝试 cv2.matchTemplate。
尝试定位轮廓，使用 cv2.approxPolyDP 简化它并猜测数字位置。

我的问题是:关于如何解决这个问题有什么建议吗？如果输入未根据分辨率/角度进行归一化，我可以使用什么其他算法来定位此表单字段？

[更新#1]

给定 (x, y, w, h) 作为左侧黑色矩形的位置和大小，我可以合理自信地缩小搜索范围。

尝试随机样本，这个公式给了我:

img.crop((x+w, y+h/3, x+h*3.05, y+2*h/3))

[更新#2]

我刚刚了解了erode和dilate，现在它们是我最好的新 friend 。

horizontal = edges.copy()
vertical = edges.copy()

kv = np.ones((25, 1), np.uint8)
kh = np.ones((1, 30), np.uint8)

horizontal = cv2.dilate(cv2.erode(horizontal, kh, iterations=2), kh, iterations=2)
vertical = cv2.dilate(cv2.erode(vertical, kv, iterations=2), kv, iterations=2)

grid = horizontal | vertical

plt.imshow(edges, 'gray')

plt.imshow(grid, 'gray')

顺便说一句，我对计算机视觉一无所知。让我们回到谷歌...

最佳答案

尝试查找场角、计算角度/比例，而不是仅仅将图像转换为标准化图像。

关于python - 如何在此图像中定位特定的表单域，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44892596/

24

4

0

文章推荐： html - 如何用计算函数填空？

文章推荐： node.js - 使用服务帐户进行 Google Sheets Api 授权

文章推荐： javascript - 砌体布局响应式排水沟

jQuery追加()定位
我必须从我的网站中删除()一些iem，然后将它们追加()回来，但是当我追加它们时，它们出现在不同的地方，而我希望它们完全显示在它们以前的同一个地方是。有什么解决办法吗？这是一个沙箱，请随意更新(注
CSS - 定位
一个。图片 (960x7)b. div(宽度:960，填充:10) 我想定位 (a)，使其距顶部 50 像素，居中。我想将 (b) 放置在 (a) 的正下方，没有空格。我的 CSS 如下: @cha
CSS 定位
放置某物的正确方法是什么？我有一个在中心显示博客文章的 div。 "" rel="bookmark"> BY LOUIS MOORE ON " pubdate>
CSS 定位
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭1
CSS 定位
我已经成功地使用了 position:fixed 设置 CSS/CSS3 并且工作得很好! 我几天前看到了这个，想知道他们是如何实现向下滚动时发生的效果的，菜单栏在滚动前处于一个位置，然后转到顶部并自
CSS:定位
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 7 年前。 Improv
slate源码解析（三）-定位
接口定义能够对于文字、段落乃至任何元素的精准定位并做出增删改查，都是在开发一款富文本编辑器时一项最基本也是最重要的功能之一。让我们先来看看Slate中对于如何在文档树中定位元素是怎么定义的
WPF tabitem 定位
例如，使用 WPF 在选项卡控件的最左上角定位三个 tabitem 和在最右上角定位一个 tabitem 的正确方法是什么？我尝试通过更改边距将第四个 tabitem 向右移动，但这并没有产生好的结
javascript - 眼睛跟随光标 - 定位？
我正在尝试使用 Javascript 创建一个跟随鼠标在页面上移动的东西。我希望它是米老鼠，我希望他的眼睛跟随鼠标移动他的眼球...这是我到目前为止的代码(从网络上的各个地方收集，因此归功于编写该部分
arduino - 射频三角测量(定位)
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 9 年前。 Improve
Java GUI - 定位
我试图将两个按钮放置在左上角。但它们始终位于顶部中心。我已经尝试过这个: jp = new JPanel(); jp.setLayout(new GridBagLayout()); GridBagC
jQuery Slide Down 定位
我在使用 JQuery 向下滑动功能时遇到问题。我可以让它正常工作，但是我向下滑动的元素的位置会根据视口(viewport)的大小而变化。我想做的是将它与它滑动的元素联系起来。 This JSfidd
javascript游戏 Sprite 定位
我正在尝试创建一个棋盘，并将其放置在屏幕中间，但到目前为止我无法将它直接放在中间。我不想将位置硬编码到屏幕上，因为我要处理不同的屏幕尺寸。 var winsize = cc.director.
mysql - 定位、子串查询
我正在尝试从 mysql 中的 2 个字符串点之间提取数据，我的示例脚本是 'otherdata&p1=textneeded&otherdata' 我需要拉出“textneeded”位，“P1=”是起
按钮的 JavaFX 定位
如何在 JavaFX 中设置按钮的位置？我的代码: bZero = new Button(); bZero.setPrefSize(45, 20); mainPane.getChildren().ad
iphone - 定位 UIScrollView
我有一个 iPhone 应用程序，我可以在其中显示一系列图像。当用户点击图像时，我需要将该图像带到第一个位置，表明它是所选图像。我可以通过子类化实现 uiscrollview 中的点击。但是我无法将
使用导航栏的 CSS 定位
在下图中，它显示了一个image、textbox 和一个css menu image 我的 CSS 菜单非常完美。我终于按照我需要的方式得到了它。我的问题是我需要导航栏中央的文本框，然后我需要我的图像
html - CSS 定位
我必须创建一个看起来像这样的 div id为2的div应该出现在图片的右下角，图片的大小不固定id=2的div应该应用什么css id =1 的 div 没有定义位置，所以使用默认值，图像也是
文本和图像在同一行的 CSS 定位
如何将我的文本和图像对齐在同一行？每当我使用 padding 或 margins 时，它就会崩溃到我正在使用的圆形图像中。 #alignPhoto { padding-right: 50px;
使用页面引用的 CSS 定位
简单的问题，如何定位具有整个页面引用的元素？在我的例子中，我在标题中得到了一个 float 图像，然后是 2 组标题。当我使用时: text-align: center; 它使用图像宽度端和页面其余

首页

博学

6Ren·AI

商城

python - 如何在此图像中定位特定的表单域

[更新#1]

[更新#2]