kwo*_*sin 5 classification machine-learning computer-vision deep-learning imagenet
用于训练的标签和用于验证的标签是否相同?我认为它们应该是相同的;然而,网上提供的标签似乎存在差异。当我从官方网站下载其验证数据的 imagenet 2012 标签时,我得到的标签以kit_fox
第一个标签开头,它与我从官方网站下载的 2012 年数据集验证图像完全匹配。这是标签的示例:https://gist.github.com/aaronpolhamus/964a4411c0906315deb9f4a3723aac57
然而,对于几乎所有预训练模型,包括那些由 Google 训练的模型,它们用于训练的 imagenet 标签实际上都是从 开始的tench, tinca tinca
。请参阅此处:https ://gist.github.com/yrevar/942d3a0ac09ec9e5eb3a
为什么会出现如此巨大的差异呢?“tincatinca”这种标签从何而来?
如果我们使用与实际验证图像相对应的第一个标签映射,我们将面临另一个问题:2 个类(“Crane”和“maillot”)实际上是重复的,即它们具有相同的名称,但指的是不同类型的起重机 -机械起重机和动物起重机 - 导致 2 个类中产生 100 个图像,而不是假设的 50 个。如果我们不使用第一个映射,那么与第二个标签映射相对应的验证图像的可靠来源在哪里?