gpt4 book ai didi

machine-learning - 为什么 imagenet 数据集标签存在差异?

转载 作者:行者123 更新时间:2023-11-30 08:49:19 24 4
gpt4 key购买 nike

用于训练的标签和用于验证的标签是否相同?我认为它们应该是相同的;然而,网上提供的标签似乎存在差异。当我从官方网站下载其验证数据的 imagenet 2012 标签时,我得到的标签以 kit_fox 开头作为第一个标签,它与我从官方网站下载的 2012 年数据集验证图像完全匹配。这是标签的示例:https://gist.github.com/aaronpolhamus/964a4411c0906315deb9f4a3723aac57

但是,对于几乎所有预训练模型(包括 Google 训练的模型)来说,它们用于训练的 imagenet 标签实际上都是以 tench、tincatinca 开头。参见这里:https://gist.github.com/yrevar/942d3a0ac09ec9e5eb3a

为什么会有这么大的差异? “tincatinca”这种标签从何而来?

如果我们使用与实际验证图像相对应的第一个标签映射,我们将面临另一个问题:2个类(“Crane”和“maillot”)实际上是重复的,即它们具有相同的名称,但引用不同类型的起重机 - 机械起重机和动物起重机 - 导致 2 个类中产生 100 个图像,而不是假设的 50 个。如果我们不使用第一个映射,则与第二个标签映射相对应的验证图像的可靠来源在哪里?

最佳答案

我在微调时也遇到同样的问题。您可以解决问题,将类名称 tench,tincatinca 更改为 synset number。您可以找到here映射

关于machine-learning - 为什么 imagenet 数据集标签存在差异?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44774958/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com