我正在使用在Tora中使用Torch进行图像处理的CNN模型(AlexNet)。我正在修改Torch入门代码。
我的问题是,我要用18个通道而不是3个通道来制作图像以训练模型,并且将这些图像发送到GPU时,要比使用3个通道发送图像的时间多20倍(每批次2.13 s)(每批0.14s)。我还试图查看将具有4个通道的图像发送到GPU所需的时间。我看到,一旦频道数量增加到3个以上,时间就会增加20倍左右。例如,即使对于具有4个通道的图像,每批也要花费2秒钟的时间,这比运行3个通道的图像大约多19倍。
我想知道是否有一个导致花费这么多时间的错误,是否没有任何错误,是否有办法减少运行时间?