Abh*_*ram 5 artificial-intelligence neural-network keras tensorflow
我正在做一些关于使用 tensorflow 训练深度神经网络的研究。我知道如何训练模型。我的问题是我必须在具有不同数据集的 2 台不同计算机上训练相同的模型。然后保存模型权重。后来我必须以某种方式合并 2 个模型权重文件。我不知道如何合并它们。是否有执行此操作的函数或应该对权重进行平均?
对这个问题的任何帮助都会很有用
提前致谢
最好在训练期间合并权重更新(梯度)并保留一组通用的权重,而不是在单独的训练完成后尝试合并权重。两个单独训练的网络可能会找到不同的最佳值,例如对权重进行平均可能会给出在两个数据集上表现更差的网络。
您可以做两件事:
在这种情况下通常:
(上述方法有多种变体,以避免计算节点空闲太长时间等待其他节点的结果)。上面假设计算节点上运行的 Tensorflow 进程在训练期间可以相互通信。
请参阅https://www.tensorflow.org/deploy/distributed)了解更多详细信息以及如何在多个节点上训练网络的示例。
归档时间: |
|
查看次数: |
1493 次 |
最近记录: |