gpt4 book ai didi

ios - Tesseract 改进和图像预处理步骤

转载 作者:行者123 更新时间:2023-11-28 21:58:47 24 4
gpt4 key购买 nike

我正在研究 Tesseract 库,下面是 Tesseract 的输入,

enter image description here

在实现的最初阶段,我只使用了身份证的“机读区”区域。但实际的意图是扫描整个文档并获取身份证中的所有文本。

我已经经历了this document要提高 Tesseract 的质量,第一步是图像应为 300 dpi。

1) 如何将 ios 中捕获的相机图像转换为 300 dpi?

2) Tesseract 提供最佳输出的最佳对比度和亮度级别应该是多少?

3) 是否有任何其他预处理步骤可以应用于图像以获得良好的准确性?

4) 为了获得更好的准确性,推荐的图像分辨率是多少?

5) 我使用 "int tesseract::TSSDLL_API::MeanTextConf" 获得置信度分数。有了每个字符的这个置信度分数,我是否有可能确定置信度分数是否高于某个百分比,然后识别的字符是准确的?如果我错了,你能解释一下“MeanTextConf”方法的用法吗?

最佳答案

前段时间我写了几篇关于图像预处理和“OCR 如何发挥最佳作用”的通用 OCR 博文。请在这里找到它们:http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

一般来说,获得足够高的分辨率应该是第一步。低分辨率根本没有每个字母的足够信息来可靠地读取字符。然后我进行自适应二值化,使用阈值将图像转换为黑白,其中背景应该是药房,字符应该保持非常清晰,没有额外的噪音或孔洞。然后,可选地,可以对各个字段进行分割,并使用特定设置分别处理每个字段,例如数字“仅数字”,性别字段“M|F”等。

关于ios - Tesseract 改进和图像预处理步骤,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25668203/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com