gpt4 book ai didi

ocr - Kofax Capture 识别 - I vs 1

转载 作者:行者123 更新时间:2023-12-04 04:05:26 24 4
gpt4 key购买 nike

使用 Kofax Capture 10(SP1、FP2),我在文档的某些字段上设置了识别区域。这些字段始终将 I's 识别为 1's。我已经尝试了我能想到的每一种设置组合,但都没有消除该字段中的所有字符,但无济于事。我已经尝试过 Advanced OCR 和 High Performance OCR,不同的字符过滤器。各种各样的东西。

我可以尝试哪些选项来自动识别这个字符?我应该告诉制作表格的人(它们是由计算机生成的)他们需要尝试使用不同的字体吗?说服他们现在是时候考虑使用验证了?

我当前的现场设置:

Kofax Advanced OCR 除了高级对话框中的“最大化准确性”外没有自定义设置。这和我迄今为止尝试过的任何其他方法一样有效。

使用的字体是 8 - 12 pt arial,顺便说一句。

最佳答案

如果涉及 OCR,则验证是必须,无论是处理电子文档还是纸质文档。对于纸质文档,这是一个更大的必须。

至少使用 11pt Arial 并将文档渲染为 300 dpi 图像。这将为您提供 99.9% 的准确度(即每 1000 个字符中有 1 个字符被遗漏)。如果您的数据中数字和字母混合在一个单词中,尤其是 1-I、0-O、6-G,则准确性可能会下降。

如果您知道您没有此类混合数据并且 OCR 仍然返回混合数字和字母,则可以使用识别脚本。您可以使用 PostRecognition 脚本事件从 OCR 引擎捕获识别结果,并使用 SBL 或 VB.NET 脚本对其进行修改。但这在很大程度上取决于您处理的文档和数据。

图像清理对电子文档没有任何好处。

我会说你最好的办法是使用验证。至少这会将责任推给验证运算符(operator)。

关于ocr - Kofax Capture 识别 - I vs 1,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13845179/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com