gpt4 book ai didi

ocr - 如何转换/匹配手写姓名列表? (HWR)

转载 作者:行者123 更新时间:2023-12-04 01:14:56 28 4
gpt4 key购买 nike

我想看看我是否可以扫描类(class)的签到表。好消息是我知道可能写出的 90% 的名字。

我的想法是使用 tessaract 来解析名称图像,然后使用 Levenshtein 算法将每一行与我数据库中的名称列表进行比较,如果我得到相当接近的匹配,那么该名称是正确的。

这种方法听起来不错吗?如果没有,其他想法?

我尝试在样本表上使用 tesseract(见下文)

enter image description here

我用了:

tesseract simple.png -psm 4 outtxt
Tesseract Open Source OCR Engine v3.05.01 with Leptonica
Warning. Invalid resolution 0 dpi. Using 70 instead.
Error in boxClipToRectangle: box outside rectangle
Error in pixScanForForeground: invalid box

我假设它不喜欢第 2 行,因为我低于该行。

我得到的结果是:
1.. AM: (harm;

l. ’E (J 22 a 00k

2‘ wau \\) [HQ

4. KIM TAYLOE
5. LN] Davis

6‘ Mzflé! Ha K

显然不是最好的,我的猜测是 4 和 5 的距离匹配会起作用,但其余的甚至不接近。

我可以控制我的签到表,但不能控制进来的人的笔迹,因此如果我可以对此做出任何更改以提供帮助,请告诉我。

最佳答案

由于您的目标是仅获取名称 - 我建议您将 tessedit_char_whitelist 减少为英文字母(“ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789. ”),这样您就不会像 \\) [ 那样获得您不希望作为输出的字符。

如果您成功地从手写图像中提取文本(这对 tesseract 来说是一项艰巨的任务),那么您计算 L 距离的初始方法就很好。

我还建议对您的图像进行一些预处理。例如,您可以删除水平线并提取它们周围的文本 ROI。在最好的情况下,您将能够提取分隔的字符,但即使您不这样做 - 您也会获得更好的结果并且能够“逐行”区分结果名称。

您还应该尝试其他推荐的输出质量改进阶段,您可以在 Tesseract OCR wiki ( link ) 中找到这些阶段

关于ocr - 如何转换/匹配手写姓名列表? (HWR),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47295363/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com