如何删除GPU内存中的变压器模型

yan*_*hen 1 pytorch huggingface-transformers

from transformers import CTRLTokenizer, TFCTRLLMHeadModel
tokenizer_ctrl = CTRLTokenizer.from_pretrained('ctrl', cache_dir='./cache', local_files_only=True)
model_ctrl = TFCTRLLMHeadModel.from_pretrained('ctrl', cache_dir='./cache', local_files_only=True)
print(tokenizer_ctrl)
gen_nlp  = pipeline("text-generation", model=model_ctrl, tokenizer=tokenizer_ctrl, device=1, return_full_text=False)
Run Code Online (Sandbox Code Playgroud)

你好,我的代码可以将变压器模型(例如这里的 CTRL)加载到 GPU 内存中。使用后如何将其从 GPU 中删除,以释放更多 GPU 内存?

显示我使用torch.cuda.empty_cache()

谢谢。

小智 5

您可以简单地del tokenizer_ctrl然后使用torch.cuda.empty_cache()

请参阅 pytorch 论坛中的此线程讨论它。