gpt4 book ai didi

algorithm - 如何在 OCR 扫描代码中添加冗余

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:58:10 25 4
gpt4 key购买 nike

这更像是一个算法问题 - 我不是很懂数学,所以一直在寻找工程解决方案...如果这与 SO 无关,请告诉我,我会删除该问题。

我创建了一个开源的 mashup,用于在复杂的背景下进行光学字符识别:https://github.com/metalaureate/tesseract-docker-ocr

我想用它来扫描带有预定义 ID 代码的标签,例如 2826672。数字的准确度约为 70%。

问题:如何以编程方式向我的代码添加冗余以将准确度提高到 99%,以及如何对其进行解码?我可以想象一些非常笨拙的方法,比如加倍和反转数字,但我不知道如何以尊重信息论的方式做到这一点,而不必翻译大量数学。

如何添加和解码数字以更正 OCR 错误?

最佳答案

如果您有实际打印标签的自由,那么就没有真正的理由坚持使用普通的 ol' 数字。请改用二维码。大小(信息容量)和信息冗余都是可配置的,因此您可以对其进行自定义以适合您的特定场景。在内部,使用 Reed-Solomon 纠错。他们提供了很多用于 QR 码生成和扫描识别的库。

更多信息请参阅 Wikipedia .

关于algorithm - 如何在 OCR 扫描代码中添加冗余,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28324241/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com