gpt4 book ai didi

iphone - 超正方 OCR : How to find the read-error-magnitude of each returned character?

转载 作者:行者123 更新时间:2023-12-03 18:58:40 24 4
gpt4 key购买 nike

我正在 iPhone 应用程序中使用 Tesseract OCR 引擎从账单发票照片中读取特定的数字字段。使用大量的照片预处理(自适应阈值处理、伪影清理等),结果最终相当准确,但仍有一些情况我需要改进。

如果用户在弱光条件下拍照,并且图片中存在一些噪点或伪影,OCR 引擎会将这些伪影解释为附加数字。在某些后面的情况下,它可以读取例如将“32,15”欧元的数字金额转换为“5432,15”欧元,这对于最终用户对产品的信心完全没有好处。

我假设,如果存在与每个读取的字符相关的内部 OCR 引擎读取错误,则我之前示例中的“54”数字会更高,因为它们是通过小噪声像素识别的,并且如果我有权访问此读取错误值,我将能够轻松丢弃错误的数字。

您知道有什么方法可以获取从 tesseract OCR 引擎返回的每个单独字符的读取误差大小(或任何“准确度因子”值)吗?

最佳答案

在 Tesseract 术语中称为“置信度”值。在 tesseract-ocr Group 中搜索该词条出现了许多提到 TesseractExtractResult 方法的答案。

hOCR output也包含这个值。

关于iphone - 超正方 OCR : How to find the read-error-magnitude of each returned character?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7060535/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com