algorithm - 如何在 OCR 扫描代码中添加冗余-6ren

algorithm - 如何在 OCR 扫描代码中添加冗余

转载作者：塔克拉玛干更新时间：2023-11-03 02:58:10

25

4

这更像是一个算法问题 - 我不是很懂数学，所以一直在寻找工程解决方案...如果这与 SO 无关，请告诉我，我会删除该问题。

我创建了一个开源的 mashup，用于在复杂的背景下进行光学字符识别:https://github.com/metalaureate/tesseract-docker-ocr

我想用它来扫描带有预定义 ID 代码的标签，例如 2826672。数字的准确度约为 70%。

问题:如何以编程方式向我的代码添加冗余以将准确度提高到 99%，以及如何对其进行解码？我可以想象一些非常笨拙的方法，比如加倍和反转数字，但我不知道如何以尊重信息论的方式做到这一点，而不必翻译大量数学。

如何添加和解码数字以更正 OCR 错误？

最佳答案

如果您有实际打印标签的自由，那么就没有真正的理由坚持使用普通的 ol' 数字。请改用二维码。大小(信息容量)和信息冗余都是可配置的，因此您可以对其进行自定义以适合您的特定场景。在内部，使用 Reed-Solomon 纠错。他们提供了很多用于 QR 码生成和扫描识别的库。

更多信息请参阅 Wikipedia .

关于algorithm - 如何在 OCR 扫描代码中添加冗余，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28324241/

25

4

0

文章推荐： java - Java 中的通用 Soap 客户端

文章推荐： java泛型编译错误

文章推荐： java - EclipseLink 的 Hibernate Envers(实体审计)

文章推荐： java - 如何构建可嵌入类型的 ElementCollection？

Java//冗余
我有下面提供的“示例代码”，我觉得这很多余，并且想请您与我一起解释是否有任何更少冗余的方法来处理以下代码。 public interface Bars { FOO1 FOO1 = (FOO1)
caching - AppFabric 冗余
我们刚刚测试了一个由 2 个服务器组成的 AppFabric 集群，我们在其中删除了“领导”服务器。第二个服务器对它的任何请求超时并出现错误: Microsoft.ApplicationServer.
mysql - 数据库模式中的外键过多(冗余？)
我正在设计一个关系数据库 - 底层是 MySQL - DBDesigner 4 . 我有 3 个表:module、page 和 lang。每个模块属于一个页面，每个页面都有特定的语言: 外键 pag
java - 冗余 If 消息
我的 Fraction 程序运行流畅，但 NetBeans IDE 告诉我以下 if 是多余的: public boolean equals(Object other) { Fraction bo
python - 冗余 If 语句和正则表达式
下面的代码显然是多余的，但根据我的经验，我经常使用这种模式。有没有更好的方法在 python 中执行此操作？ if re.search("at (\d{1,2}):\d{2}", p): a=
java - 当组件已经测试时测试复合对象 ->冗余？
我有一个用具体示例说明的一般性问题。当所有组件对象都已测试时，您建议对复合对象进行多少测试？作为具体示例，请考虑下面的 NullTerminatedStringReader。它从字节缓冲区中读取一个
java - 冗余 If 语句警告
if ( a > b) { return true; } return false; 对于上面的代码，Netbeans 给出了 “Redundant if statement” 警告并建议将其更改
SQL 冗余 NOT NULL 约束
当我添加一些约束时，例如: create table Test( IDTest int primary key, Credit int not null constraint Credit
c - 冗余 __packed__ 属性
此代码适用于 Microchip 的 PIC32MX 微处理器。他们的编译器本质上是 GCC 3.4。我倾向于使用 GCC 的 __packed__ attribute将位域打包到一个 union
Golang 类型切换需要(冗余)类型断言
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
ios - 如何防止数据库中的APNS设备 token 冗余
我正在为我的应用程序使用apns通知，为此，我将apns设备 token 存储在我的sql数据库中。问题在于，每次用户删除或安装该应用程序时，它都会生成一个新的设备 token ，并将其存储在数据库
mysql - 冗余 MySQL 索引？
Action Keyname Type Unique Packed Column Cardinality Collation Null Comment Edit Dro
c - 冗余 IRQ 清除挂起操作
我正在开发一个使用 ARM Cortex-M0 处理器的项目。在这个项目中，我需要提供计时器支持(CMSDK (SSE-200)计时器)。因此，在 vector 表中，在 TIMER0_IRQn 表
java - CorsFilter setAllowedOrigins(*) 冗余
有没有写的理由 corsFilter.setAllowedOrigins(new HashSet(Arrays.asList("*"))); 其中allowedOrigins在ReSTLet框架中的定
HTML 页面 - 页眉和页脚 - 冗余
我正在创建一个包含 4 个链接的 HTML/CSS 页面， Home.html Details.html ContactMe.html AboutUs.html 我想在所有关联的 HTML 页面中将其
c++ - 如何避免两个不同头文件中的 typedef 冗余？
我试图理解并使用其他人编写的代码，但由于我对 typedef 经验不多。 , 我有时会感到困惑。有两个不同的头文件，一个继承另一个，并且在两个文件上声明相同的typedef。为什么会出现冗余，如何
html - CSS 中选择器的速度/冗余
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
android - 避免改造 POJO 冗余
我有一个用于改造的 POJO 类。 public class AppData(){ String a; String b; String c;
c# - 冗余 ToString 代码？
我想知道: 编写这段代码: DataRow[] g = new DataRow[1] ; var t=new StringBuilder().AppendFormat("{0}", g[0]["a
c# - 冗余 "using"是否会降低性能
只是一个性能问题...... 假设我有 5 个类，每个类都引用了 System.Data 和一个自己开发的库。这 5 个类是类库的一部分，最终将被构建并发布到一些 Web 应用程序作为引用。通过将引

首页

博学

6Ren·AI

商城

algorithm - 如何在 OCR 扫描代码中添加冗余