了解 PyTorch DataLoader Worker 的内存使用情况

Question

了解 PyTorch DataLoader Worker 的内存使用情况

Ath*_*dom 12 python ubuntu python-3.x deep-learning pytorch

使用num_workers=32for运行 PyTorch 训练程序时DataLoader，htop显示 33 个 python 进程，每个进程具有 32 GBVIRT和 15 GB 的RES.

这是否意味着 PyTorch 训练使用了 33 个进程 X 15 GB = 495 GB 的内存？htop显示只有大约 50 GB 的 RAM 和 20 GB 的交换在整个机器上使用，具有 128 GB 的 RAM。那么，我们如何解释这种差异呢？

是否有更准确的方法来计算主 PyTorch 程序及其所有子 DataLoader 工作进程使用的 RAM 总量？

谢谢

Answer 1

Cof*_*ict -1

python 有一个名为tracemalloc 的函数，用于跟踪分配给python 的内存块。https://docs.python.org/3/library/tracemalloc.html

回溯
每个文件名的内存统计
计算快照之间的差异

import tracemalloc
tracemalloc.start()
do_someting_that_consumes_ram_and releases_some()
# show how much RAM the above code allocated and the peak usage
current, peak =  tracemalloc.get_traced_memory()
print(f"{current:0.2f}, {peak:0.2f}")
tracemalloc.stop()

Run Code Online (Sandbox Code Playgroud)

https://discuss.pytorch.org/t/measuring-peak-memory-usage-tracemalloc-for-pytorch/34067

归档时间：	5 年，3 月前
查看次数：	393 次
最近记录：	4 年，4 月前