- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在 iPhone 应用程序中使用 Tesseract OCR 引擎从账单发票照片中读取特定的数字字段。使用大量的照片预处理(自适应阈值处理、伪影清理等),结果最终相当准确,但仍有一些情况我需要改进。
如果用户在弱光条件下拍照,并且图片中存在一些噪点或伪影,OCR 引擎会将这些伪影解释为附加数字。在某些后面的情况下,它可以读取例如将“32,15”欧元的数字金额转换为“5432,15”欧元,这对于最终用户对产品的信心完全没有好处。
我假设,如果存在与每个读取的字符相关的内部 OCR 引擎读取错误,则我之前示例中的“54”数字会更高,因为它们是通过小噪声像素识别的,并且如果我有权访问此读取错误值,我将能够轻松丢弃错误的数字。
您知道有什么方法可以获取从 tesseract OCR 引擎返回的每个单独字符的读取误差大小(或任何“准确度因子”值)吗?
最佳答案
在 Tesseract 术语中称为“置信度”值。在 tesseract-ocr Group 中搜索该词条出现了许多提到 TesseractExtractResult 方法的答案。
hOCR output也包含这个值。
关于iphone - 超正方 OCR : How to find the read-error-magnitude of each returned character?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7060535/
我正在做一个小型 2D 坦克炮塔游戏,您可以在屏幕中间旋转坦克,单击左键,然后一个小炮弹就会移动到那个位置。 我目前处于我拥有当前位置和所需位置的位置,我现在需要做的是获取这两个点的大小,它们应该返回
我对 Java 语言规范中“总体规模”的含义感到困惑: Widening primitive conversions do not lose information about the overall
我正在使用 Kaffe JVM(相当于 java 1.1)加密数据,并尝试使用 JDK7 解密数据。 在我的算法中,我使用 BigInteger(RSA 加密)。当我在 JDK 中测试应用程序时,一切
因此,我对组装非常陌生,我们为学校分配了计算机功能: z = x ^ 2 * y-16(4-y) 我已经使用MASM尝试对其进行编译,以确定它是否可以工作,但是我一直收到错误消息,错误2071:初始化
我正在查看这段代码,但不知道这个magnitude 和normalized 是做什么的,也不知道这个人是如何使用它们的。在文档中只有很少的东西,但并没有解释太多。 我正在查看的代码是: public
如何使用 magnitude和 absdiff ?我阅读了the documentation中的解释,但每次它都会出错,因为我不明白输入数组和输出究竟应该如何。应该是vector , Mat或 Sca
我正在 iPhone 应用程序中使用 Tesseract OCR 引擎从账单发票照片中读取特定的数字字段。使用大量的照片预处理(自适应阈值处理、伪影清理等),结果最终相当准确,但仍有一些情况我需要改进
我正在做一个小项目,我做了一个领袖统计,然后在领袖统计中是点,当你离开和加入时,分别设置和检索数据,跟踪玩家的等级,当玩家接触到它时改变点数,除了我有时会出错,有时不会。。脚本是:。一切顺利,然后我得
今晚早些时候,我问了this question on StackOverflow关于如何编写 SQL 查询以通过仅返回在一个字段中具有重复项的行来过滤表中的行。 这里是问题,为方便起见重复: 如果我有
我是一名优秀的程序员,十分优秀!