gpt4 book ai didi

microsoft-cognitive - 如何确定为什么一个词被包含在 vision api 的描述中

转载 作者:行者123 更新时间:2023-12-04 18:29:36 25 4
gpt4 key购买 nike

我在图像上使用了计算机视觉 API。在描述图像时返回了比萨这个词,我能做的唯一与比萨的联系是餐巾纸上的比萨公司 Logo 。生日这个词也被返回了。有什么方法可以判断返回的单词 pizza 是因为公司 Logo ,还是与单词 birthday 相关的猜测?

最佳答案

这取决于 API 返回给您的详细信息量。如果它允许您观察用于对图像进行分类的分类器的中间输出,您可以看到图像的哪些部分产生了高输出值。餐巾纸上的披萨公司 Logo 很可能会导致这种情况,具体取决于它出现的大小。

如果您使用更开放的 API 和分类器,例如 keras 和 keras.applications 下提供的网络,您可以使用所谓的“类激活图”来查看图像的哪些部分导致了结果。

如果您发现也必须执行上述操作,调查原因的一种简单方法是使用循环裁剪部分图像并将它们传递给 API。我怀疑“生日”可能与分布式特征有关,您可能无法找到它的来源,而披萨可能来自 Logo 或图像的其他部分。

关于microsoft-cognitive - 如何确定为什么一个词被包含在 vision api 的描述中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50493446/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com