我已经使用 Tensorflow 后端为图像分类任务实现了 Keras 顺序模型。它有一些自定义层来替换 Keras 层,如 conv2d、max-pooling 等。 但是添加这些层后,虽然保留了准确性,但训练时间却增加了数倍。所以我需要看看这些层是在前向传播还是后向传播(通过反向传播)或两者都需要时间,以及这些操作中的哪些需要可能优化(使用 Eigen 等)。
但是,我找不到任何方法来了解模型中每个层/操作所花费的时间。检查了 Tensorboard 和回调的功能,但无法了解它们如何帮助计时训练细节。有没有办法做到这一点?谢谢你的帮助。