我运行了一个强化学习训练脚本,该脚本使用 Pytorch 并将数据记录到 tensorboardX 并保存检查点。现在我想继续训练。我如何告诉tensorboardX从我离开的地方继续?谢谢你!
我在 pytorch 1.3.1 中使用tensorboard,并且我在pytorch 文档中为tensorboard做了完全相同的事情。运行后tensorboard --logdir=runs
,我得到了这个:
。
$ tensorboard --logdir=runs
TensorFlow installation not found - running with reduced feature set.
Serving TensorBoard on localhost; to expose to the network, use a proxy or pass --bind_all
TensorBoard 2.1.0 at http://localhost:6006/ (Press CTRL+C to quit)
Run Code Online (Sandbox Code Playgroud)
打开 http://localhost:6006/ 后,我得到这样的空白页面
我也尝试了tensorboardX,并得到了相同的结果。您能告诉我如何解决这个问题吗?谢谢。
我正在关注 Pytorch 的Tensorboard文档。
我有以下代码:
model = torchvision.models.resnet50(False)
writer.add_graph(model)
Run Code Online (Sandbox Code Playgroud)
它抛出以下错误:
_ = model(*args) # 不捕获,只打印错误信息
TypeError:* 之后的 ResNet 对象参数必须是可迭代的,而不是 NoneType
我不知道我在这里做错了什么!
我注意到,无论我将多少图像保存到张量板日志文件中,张量板都只会显示其中的 10 个(每个标签)。
我们如何增加图像数量或至少选择显示哪些图像?
要重现我的意思,请运行以下 MCVE:
import torch
from torch.utils.tensorboard import SummaryWriter
tb = SummaryWriter(comment="test")
for k in range(100):
# create an image with some funny pattern
b = [n for (n, c) in enumerate(bin(k)) if c == '1']
img = torch.zeros((1,10,10))
img[0, b, :] = 0.5
img =img + img.permute([0, 2, 1])
# add the image to the tensorboard file
tb.add_image(tag="test", img_tensor=img, global_step=k)
Run Code Online (Sandbox Code Playgroud)
这将创建一个runs
保存数据的文件夹。从同一文件夹执行tensorboard --logdir runs
,打开浏览器并转到localhost:6006
(或替换6006
为启动后显示的任何端口张量板)。然后转到“图像”选项卡并将滑块移动到灰度图像上方。
就我而言,它仅显示步骤中的图像
k = 3, 20, …
Run Code Online (Sandbox Code Playgroud)