gpt4 book ai didi

forms - 通过字段识别和光学字符识别 (OCR) 在预定义表格上进行手写数据输入自动化

转载 作者:行者123 更新时间:2023-12-02 17:38:07 27 4
gpt4 key购买 nike

我希望从手工填写的预定义表格中自动输入数据。字符没有分开,但字段可以通过下面的行或作为表格的一部分来识别。我知道手写 OCR 仍然是一个活跃的研究领域,并且我可以包括运算符(operator)审查功能,所以我不希望准确率超过 90%。

我想到的第一个解决方案是结合使用 OpenCV 进行字段识别( http://answers.opencv.org/question/63847/how-to-extract-tables-from-an-image/ )和 Tesseract 来识别笔迹( https://github.com/openpaperwork/pyocr )。

使用预定义表格进行字段识别的另一种可能更简单和更有效的方法是以某种方式从填写的表格中减去空白表格。由于表格会被扫描,这可能需要一些位置容差、降噪和特征识别。

任何建议或意见将不胜感激。

最佳答案

正如 Tesseract FAQ 中所说如果您正在寻找成功的手写识别,不建议使用它。我建议您更多地研究商业项目,例如 Microsoft OCR API (向下滚动到从图像中读取手写文本),您可以在线尝试并在您的应用程序中使用他们的 API。

另一个选择是 ABBYY OCR,它有很多有用的功能来识别表格、复杂的文档等。你可以阅读更多 here

至于免费替代品 - 唯一想到的是 Lipi toolkit

至于字母的检测 - 它实际上取决于输入,一般来说,如果您的表格每次都或多或少相同 - 最好简单地测量您的表格并使用您需要搜索文本的预定义位置。否则 OpenCV 是一种寻找文本的正确技术,网上有很多教程,stackoverflow 上有很好的答案,例如你可以看看 detection using MSER消音器的回答。

关于forms - 通过字段识别和光学字符识别 (OCR) 在预定义表格上进行手写数据输入自动化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48013296/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com