gpt4 book ai didi

c# - 字体不变的简化 OCR

转载 作者:太空宇宙 更新时间:2023-11-03 14:08:27 24 4
gpt4 key购买 nike

我正在从事一个需要更简单、更准确的 OCR 工具的项目

我的场景:

  • 每周图像都具有相同的结构
  • 我有一个小区域需要从中获取号码
  • 我需要从中获取带连字符的文本的另一个小区域
  • 字体始终相同(这是我可以获得更准确的地方)
  • 除了平面光栅化图像外,没有其他图像选项
  • 核心软件是用 C# 编写的,因此最好使用 CLI 语言。
  • 图像为 300 dpi,因此有很好的工作基础

我会使用普通的 OCR 程序,但我知道我可以获得更准确的结果,即使不是完美的结果,因为它始终是相同的字体。

那么,什么是好的方法呢?我不想做大量的工作从头开始写这个,但我不想要一个预先训练过的过度通用的 OCR 工具。我想用这一种字体训练它,这样它会得到非常准确的结果。我也不想进行分离单词和查找字母行等的特征提取。

最佳答案

我可能会使用 OpenCV 的机器学习(例如使用 haar 级联),除非角色的位置真的是完全静态的——在那种情况下,简单的比较就可以解决问题(例如,使用差的绝对和找到最佳匹配) .

字体固定了吗?如果没有,您可以使用一种特殊的 OCR 字体来获得难以混淆的字符,即使是在较差的图像上也是如此。

尽管如此,考虑到您说您想教授它,您最好选择机器学习。

关于c# - 字体不变的简化 OCR,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8607927/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com