大量标签的热门编码

Nip*_*pun 1 deep-learning tensorflow one-hot-encoding

我对一个问题感到困惑,并希望得到你的意见.我正在研究张量流中的卷积神经网络.现在我有带标签的图像.大约有10000个唯一标签,我希望图像能够自动标记.现在我使用一个热编码标签.对于10000个唯一标签,它将像功能故障一样.我们如何处理这种情况?

facebook如何在面部标记中做到这一点?有数百万的面孔.我猜他们没有为face标签做一个热编码吗?

Oli*_*rot 5

在人脸识别中,处理数百万个类的标准方法是使用嵌入.CNN产生的嵌入大小在64到1024之间.

在这个嵌入空间中,每类图像应该形成一组图像,不同类的簇应该相距很远.


Facebook的方法在他们的DeepFace论文(2014年6月)中有所描述,但我建议使用谷歌使用三联体丢失的近期方法:FaceNet:用于人脸识别和聚类的统一嵌入.

三重损失