是否可以将多个图像输入输入到卷积神经网络

Ade*_*lov 7 machine-learning computer-vision deep-learning conv-neural-network tensorflow

我有一个包含许多图像的数据集,其中图像具有同一类的 5 倍放大倍数(x10、x20、x30、x40、x50),但它们不是序列数据,并且所有图像都处于 RGB 模式,大小为 512x512,我想要把这 5 张图像作为 CNN 的输入,我不知道怎么做。另外,还有一个问题是,一旦模型在 5 个图像管道上得到了很好的训练,当我只有一张图像(一个放大倍数,以 x10 为例)时,它可以工作吗?

ali*_*ift 5

您问了两个问题。\n对于第一个问题,有两种方法可以实现。1-你可以按照输入大小为5\xc3\x97512\xc3\x97512\xc3\x973的方式设计模型,然后你去训练模型。

\n

对于第二个问题,您需要以处理特征或缺失特征的方式设计模型feature absence。对于我能想到的复杂模型,你可以这样设计模型,\n每个图像有 5 个输入,每个图像经过一个或多个 CNN,经过一层或几层后将它们合并在一起.\n对于每个输入,您可以考虑一个附加特征,一个布尔值来指示当前图像是否应在训练中考虑(不存在或存在)。在训练过程中,您应该将所有 5 张图像进行组合,并考虑其中一些图像的缺失,以便您的模型学会处理输入中 5 张图像中缺失一张或多张图像的情况。\n我希望我说得足够清楚并且有帮助。\n祝你好运。

\n

  • 1- 这种方法的缺点是,在测试过程中,您将根据 5 项中的一项进行分类,这意味着您不会使用全部信息来做出决定。虽然你可以进行多数投票或类似的事情作为后处理技巧,但你仍然有最多 5 个单独的分类,并且你不使用分类部分中的共享信息。2-使用 LSTM 可能可行,但从逻辑上讲,我不明白为什么应该考虑 5 个不同图像之间的序列。 (2认同)