小编use*_*033的帖子

RLlib 训练一次迭代中的时间步数

我是强化学习的新手,我正在使用 RLlib 在 OpenAI 健身房中研究自定义环境的 RL。创建自定义环境时,是否需要在__init__()方法中指定剧集数?另外,当我用

for _ in range(10):
     trainer.train()
Run Code Online (Sandbox Code Playgroud)

在一次迭代中采取了多少时间步?它是否等于自定义环境中定义的剧集数?谢谢你。

python reinforcement-learning ray rllib

5
推荐指数
1
解决办法
707
查看次数

matplotlib 子图中的图例位置

我正在尝试在(6X3)网格上创建子图。我对图例的位置有问题。图例对所有子情节都是通用的。lgend 现在与 y 轴标签重叠

我尝试删除 constrained_layout=True 选项。但这在图例和子图之间保留了很多空白。

import numpy as np
import matplotlib.pyplot as plt
#plt.rcParams["font.family"] = "Times New Roman"
#plt.rcParams.update({'font.size': 12})

font = {'family' : 'Times New Roman',
        'size'   : 14}  
plt.rc('font', **font)


t = np.linspace(0,10, num=200)
fig, axs = plt.subplots(6, 3, figsize=(12,16))#, constrained_layout=True)
i = 0 # i = 0 for x = 0.25; i = 3 for x = -0.25
j = 6 # j = 6 for x = 0.25; j = 9 for x = …
Run Code Online (Sandbox Code Playgroud)

matplotlib

3
推荐指数
1
解决办法
4198
查看次数

Julia中的调试选项

我在原子ide中使用Juno包来调试Julia代码.我怎样才能进入这个功能?该函数从不同的文件导入.我可以通过选择它们然后按"ctrl + enter"来执行一组行.是否有任何捷径进入函数并在函数中逐行执行.谢谢.是否可以使用gdb调试Julia代码?谢谢.

debugging gdb julia

2
推荐指数
1
解决办法
324
查看次数

基于输入数据的Keras中的自定义损失函数

我正在尝试使用Keras创建自定义损失函数。我想根据输入来计算损失函数并预测神经网络的输出。

我尝试在Keras中使用customloss函数。我认为y_true是我们为训练提供的输出,而y_pred是神经网络的预测输出。以下损失函数与Keras中的“ mean_squared_error”损失相同。

def customloss(y_true, y_pred):
    return K.mean(K.square(y_pred - y_true), axis=-1)
Run Code Online (Sandbox Code Playgroud)

除了mean_squared_error损失,我还想使用神经网络的输入来计算自定义损失函数。有没有一种方法可以将输入作为自定义函数的参数发送到神经网络。

谢谢。

keras

0
推荐指数
2
解决办法
1888
查看次数