小编xeb*_*xeb的帖子

使用不同 GPU 进行 Transformer 的多 GPU 训练

我想使用 Huggingface\xe2\x80\x99s Transformers 微调 GPT-2 模型。最好是中号型号,但如果可能的话大号。目前,我有一块内存为 11GB 的 RTX 2080 Ti,我可以很好地训练小模型。

\n\n

我的问题是:如果我将旧的 Tesla K80 (24GB) 添加到我的机器并分发训练,我会遇到任何问题吗?我找不到有关在训练期间使用不同容量 GPU 的信息以及我可能遇到的问题。

\n\n

我的模型大小限制本质上是所有可用 GPU 内存的总和吗?(35GB?)

\n\n

我\xe2\x80\x99m 对在AWS 中执行此操作不感兴趣。

\n

machine-learning huggingface-transformers

6
推荐指数
1
解决办法
2101
查看次数