gpt4 book ai didi

probability - 使用图像识别确定对象身份

转载 作者:行者123 更新时间:2023-12-04 03:30:03 26 4
gpt4 key购买 nike

我编写了一些图像分析软件,可以确定它认为是图像中最主要对象的基本形状、颜色和尺寸。

我还创建了一个对象数据库供算法选择:

Item | Shape | Colors | Width range | Height range

Box | rectangle | brown, black, white | 20-50 cm | 10-30 cm
Basketball | circle | orange | 20-25cm | 20-25 cm
Backpack | rectangle | black | 40-50 cm | 20-30 cm
.
.
.
etc.

例如,系统检测到一个宽 42 厘米、高 26 厘米的黑色矩形。在这种情况下,“盒子”和“背包”都可以作为正确答案。是否有任何好的方法可以对这两个项目中的哪一个进行有根据的猜测,例如它有 75% 的可能性是背包,25% 的可能性是盒子(可能基于盒子有可能是 3不同的颜色和更广泛的尺寸范围,而不是只能是黑色的背包)?

也欢迎其他建议。我必须自学图像识别,所以如果我应该尝试从图像中提取其他东西,或者我应该以不同的方式处理数据库,那么这些评论也将不胜感激!

最佳答案

对于相当高层次的描述而没有太多解释其工作原理的理由,我们深表歉意,但是您可以轻松地填写回答该问题的书籍,而且已经是下午 1 点了,所以我必须简短一点:


除了记录盒子和背包的可接受尺寸范围外,您还需要定义概率分布。很可能您只使用 (2D) 正态分布,然后记录均值和变化而不是范围。对具有合适概率分布的形状、颜色等变量执行相同操作。

然后像这样生成两个包含几百个数据点的数据集:

p_1 = (shape=rectangle, color=black, width=12, height=34)
p_2 = (shape=circle, color=red, width=34, height=11)
...

对于其中一组,手动将它们分类为最符合描述的对象。那将成为您的验证集。

取另一个数据集并训练分类算法,如Fisher's linear discriminant使用该数据。您获得一个转换 T,它将最大化类(表示对象的数据点组)之间的“距离”并最小化属于同一组的点之间的“距离”。

当您的程序检测到具有属性的新对象时

o = (shape=rectangle, color=black, width=42, height=26)

您应用从 Fisher 的 LD 获得的转换并测量相关性(标量向量乘积)到您分类为的数据点的转换,即计算 (T*o)*(T*p_backpack)'(T*o)*(T*p_box)' 与对象 o 实际上是背包/盒子的概率有关。

关于probability - 使用图像识别确定对象身份,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5797490/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com