gpt4 book ai didi

python - 寻找一点 python 机器学习建议

转载 作者:行者123 更新时间:2023-11-28 18:36:22 27 4
gpt4 key购买 nike

我有兴趣涉足 Python 和机器学习/自动数据输入。然而,随着我研究的进展,我意识到有很多不同的技术,每种技术都有自己的优势。

我已经决定,如果我朝相反的方向学习,我可能会走得更远。 IE。选择一个问题/任务并通过解决/完成它来学习。

我偶尔需要对传真的发票进行数据处理,我希望制作一个程序,可以在我扫描后为我输入这些发票。

传真基本上由 2 个相同的表格组成。每行表示一个单独的 worker 。第一列是 worker 姓名(从 6 中选择),第二列是地址,其余列是表示不同工作的勾选框。页面顶部的框中还有一个发票 ID。

我希望有人能简要解释一下他们将如何处理这件事。他们是否会使用 SVM 进行文本识别或其他技术?以及如何让程序理解第 5 个框中的勾号表示“cleaned=yes”,左上角框中的数字是 ID。我做了一些研究,但不知道如何开始。如何隔离传真的各个部分,例如当由于传真/扫描而无法保证绝对位置/大小时,顶部表格及其来自页面其余部分的单元格。或者我是否必须获得数百份传真+这些传真的键入数据然后比较它们然后让它自己慢慢学习传真a和b之间的区别在这里打勾,而ID号通常在这里......

欢迎任何建议!

最佳答案

从广义上讲,您可以将此过程分为两个阶段:

  1. 确定文本的位置。它位于 ml 和计算机视觉的交叉点,因为在文本识别部分之前,您需要找到该文本所在的位置。这不是一件容易的事,你可以找到线条,盒子等,看opencv lib 例如,它可能对与 CV 相关的任务有用。如果您的所有文档都具有相同的精确形式(字段相对于扫描列表本身的位置)并且您可以完美地扫描它们而没有扭曲(旋转,偏移)您可以尝试在字段所在的静态区域中搜索文本。

  2. 找到文本后,您必须将每个字段的内容分解为单词,然后将单词分解为字符,然后您可以将这些字符输入识别器(ML 部分)并获取每个字符本身的标签.而且手写文本几乎不可能(现在),因此在一般情况下很难识别手写文本。即使字段仅包含打印文本,我也建议您避免执行此步骤,并为 OCR 使用特殊库,例如 tesseract

关于python - 寻找一点 python 机器学习建议,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32089023/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com