gpt4 book ai didi

python - 如何根据图像质量确定使用哪种 OCR 方法

转载 作者:行者123 更新时间:2023-12-01 00:14:00 28 4
gpt4 key购买 nike

我问一个问题,因为我两周的研究开始让我非常困惑。

我有一堆图像,我想从中获取运行时的数字(强化学习中的奖励功能需要它)。问题是,它们对我来说非常清楚(我知道这对于 OCR 系统来说是完全不同的事情,但这就是为什么我提供额外的图像来显示我正在谈论的内容)

enter image description here enter image description here enter image description here

我这么认为是因为它们相当清楚。因此,我尝试使用 PyTesseract,当它不起作用时,我尝试研究哪些其他方法可能对我有用。

...我的搜索就这样结束了,因为花了两周时间试图找出最适合我的问题的方法,结果却引发了更多问题。

目前我认为最好的解决方案是从 MNIST/SVNH 数据集创建数字识别模型,但这不是有点矫枉过正吗?我的意思是,图像是标准化的,它们是灰度的,它们很小,并且数字字体保持不变,所以我认为有更简单的方法来修改这些图像/使用不同的 OCR 方法。

这就是为什么我问两个问题:

  1. 哪种方法对我的案例最有用(如果不是模型)使用 MNIST/SVNH 数据集进行训练?
  2. 是否有任何类型的文档/书籍/资源可以使基础设施的实际选择变得更容易?我的意思是,比方说以后我会再次来计划使用哪个OCR系统。我应该根据什么做出选择?是否纯粹是反复试验东西?

最佳答案

如果您需要识别的是那 7 段数字,请忘记任何 OCR 软件包。

使用窗口的轮廓来查找数字的大小和位置。然后计算七个预定义区域中面向片段的黑色像素。

enter image description here

关于python - 如何根据图像质量确定使用哪种 OCR 方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59445813/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com