gpt4 book ai didi

image-recognition - 开源对象识别算法

转载 作者:行者123 更新时间:2023-12-04 07:48:33 26 4
gpt4 key购买 nike

我一直在对用于我的对象识别程序的正确算法进行大量搜索。但我发现的一切都有一些重大缺陷。

我的程序应该在遇到新对象时在线学习它们。当它遇到一个新对象时,在它上面有一个框并学习该对象(OpenTLD 完美地做到了这一点)。对不同的对象重复这 1000 次,程序应该能够识别 1000 次对象的类和实例(Haar-like 特征级联可以做到这一点,OpenTLD 失败)。该算法必须是尺度和方向不变的(Haar 失败)。

我发现的所有东西都只能满足上述标准中的一部分,而其余的都失败了。令人惊讶的是,我还遇到过任何可以满足所有标准的东西。我在上面只提到 Haar 和 OpenTLD,因为它们是最接近我需要的。其他算法,如 SIFT、SURF 甚至离我需要的更远。

所以我的问题是,是否有任何现有的源代码可以满足我的需求?或者这只是我修改现有源代码会更好吗?

最佳答案

TLD 和 Kalal 的工作非常适合跟踪。然而,识别是一个非常不同的问题。

我不明白你为什么不理会 SIFT 或 SURF 以获得认可。我肯定会朝那个方向看。定向梯度直方图 (HoG) (Wikipedia) 是一系列相关的算法,被认为是最先进的。例如,它在许多 ICIP'11 论文中以一种或另一种形式使用。

您所问的问题在计算机视觉中仍然几乎是一个 Unresolved 问题。您不会找到很多现成的代码。研究代码(例如 Matlab),用于非商业用途,是的,但您可能需要对其进行大量修改/优化以供实际使用。一些公司如 Pongr、Kooaba、IQEngines 提供用于对象识别的在线 API。

关于image-recognition - 开源对象识别算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7719802/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com