gpt4 book ai didi

python - 检测和计算图像中的对象

转载 作者:太空宇宙 更新时间:2023-11-03 21:46:08 26 4
gpt4 key购买 nike

我正在尝试用 Python 编写脚本来检测和计算图像中的对象,但我失败得很惨。

这是我第一次对计算机视觉产生兴趣并尝试一些东西。我已经按照有关特征匹配和模板匹配的教程尝试使用 cv2 模块(打开 cv)here .我也尝试过使用 scikit-image,但我也无法取得好的结果。我也考虑过寻找轮廓,然后进行二维曲线匹配。

让我再解释一下这个问题。我有一组图标,它们构成了一个大图像。这个图像或场景的组成是由一个简单的背景或一个透明的背景,以及来自图标集中的一些图像完成的。 iconset 中的这些图像基本上可以进行 3 种基本变换:缩放、旋转和平移。它们也可以重叠。

An quick example by means of Android version icons.

所需脚本的输出将类似于:

C -> 1

D -> 1

E -> 1

F -> 1

G -> 1

H -> 2

我 -> 3

J -> 0

我现在要尝试使用 Dlib,看看我是否可以使用机器学习算法取得一些成果。我认为我正在尝试通过实际需要的更复杂的方法来解决我的问题。任何关于如何做到这一点的建议都会很棒,我也愿意接受任何 python 库。

PS:很抱歉没有在这里发布图片,但我还没有足够的声誉。

最佳答案

您可以尝试许多技巧。但是,如果您真的想快速轻松地制作一些东西,请尝试操纵您的图像集,使每个类别都具有明显不同和独特的颜色。因此,您可以通过寻找对象的颜色来判断对象是否存在,甚至可以更好地计算特定颜色的轮廓数。

伪代码:

  1. 预处理图像——(通过使用反投影函数对目标颜色进行归一化、阈值处理)
  2. 找到轮廓
  3. 对于每个轮廓
    1. 检查它是否是有效的“特征”轮廓——稍后您可以通过过滤一些噪声区域来进一步增强您的程序
    2. 估计它最可能属于的类别。

这也应该给你相当不错的性能速度。否则,您必须对图标的比例、旋转、遮挡/重叠情况做出一些假设。

关于python - 检测和计算图像中的对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26428644/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com