gpt4 book ai didi

c# - 查找车牌中每个字符的边界框

转载 作者:行者123 更新时间:2023-11-30 17:16:00 25 4
gpt4 key购买 nike

我将 emgu 与 c# 结合使用来读取图像中的车牌。边缘检测后我想找到其中每个字符的边界框并使用神经网络来识别字符。我该怎么做?谢谢

最佳答案

既然可以检测到车牌,那么最简单的方法就是寻找分界线。恐怕我只能从谷歌图像中推测伊朗车牌(如果这是你使用的)但是在每个字母之后都有一个中断和一个白色或黄色区域。

查找单个字母的边界框:

您可以查看列的总和以及黄色或白色峰值的位置,并将其作为分界点。或者你可以只对黑色成分或文字求和,在理想情况下,你将从 0 开始找到黑色成分,然后返回到 0 的计数,你就得到了你的字母。这里可能需要一些适应性强的统计数据。

[编辑]从图像中分割车牌。首先查看每列的总和,您会注意到 255 * 车牌图像高度的峰值。使用它作为你的阈值,找到这些峰的中间,你有一个点表示字母边缘。您可以使用此数据分割图像。

现在可能很难从统计上可靠地分割峰值,但以防万一。反转图像,使白色变成黑色,黑色变成白色。再次取列的总和,在这种情况下,峰值是字母的位置,现在您寻找从 0 到 >1 的变化,然后等到再次找到 0。记录发生这种情况的 x 位置将为您提供字母位置。如果需要,我会给你列总和的代码,但谷歌也会得到你的答案所需的统计数据就是你,只需翻译这些步骤。

另一种方法

将图像分成单独的正方形或区域的替代方法和学生最喜欢的方法是简单地在车牌上扫描一个掩码。因此,您将第一个 ROI 输入神经网络 (NN),例如 (0,0,100,100),然后沿 y 轴 (0,1,100,100) 移动一个。继续此操作,直到读入所有数据。显然,您冒着 NN 过度检测的风险,因为它可以对同一个字母进行多次分类,因此当您对一个字母进行分类时,您总是可以跳转 20 个像素左右,从而消除错误分类。

显然,您需要减小车牌图像的大小才能使此方法更快。我已经看到使用 9 x 9 阵列的精确 OCR,但是你需要更大的使用你最好的判断 20x20 应该足够但看看。

[编辑]效率

哪个更好?这得看情况。它们都可以工作(取决于神经网络训练),但是寻找单个字母的边界框所涉及的方法可能很难可靠地设置。将所有数据输入神经网络的掩码扫描通常非常可靠,但效率可能非常低。如果您使用 20*20 图像,即 400 个数据点输入神经网络,您必须乘以车牌宽度 -20。这将为您提供循环中的最大迭代次数。

NN 可能需要很长时间来训练,但也会使用大量数据执行(取决于 NN)。分割每个字母的方法效率更高,因为您实际上对 NN 的了解更少,并且可以将更准确的数据输入到您的 NN 中。

您面临的问题是,如果您使用已经内置到 EMGU OCR 识别中的 OCR 引擎非常快。正如您将能够在 EMGU 示例中看到的那样,决定最佳方法的唯一方法是编写并比较所有 3 种方法。如果您只需要一个可以工作的,那么使用 NN 一个,在您获得匹配注释的地方作为您的投资返回率字母,因为您仍然会知道牌照上的 X 位置。

很抱歉,我不能更直接地回答您哪些是最好的,但有两个因素可能会影响事情。

我希望其中一些方法对您有所帮助,

非常感谢克里斯

关于c# - 查找车牌中每个字符的边界框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7581920/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com