小编use*_*033的帖子

RLlib 训练一次迭代中的时间步数

我是强化学习的新手，我正在使用 RLlib 在 OpenAI 健身房中研究自定义环境的 RL。创建自定义环境时，是否需要在__init__()方法中指定剧集数？另外，当我用

for _ in range(10):
     trainer.train()

Run Code Online (Sandbox Code Playgroud)

在一次迭代中采取了多少时间步？它是否等于自定义环境中定义的剧集数？谢谢你。

python reinforcement-learning ray rllib

use*_*033

lucky-day

5
推荐指数

1
解决办法

707
查看次数

matplotlib 子图中的图例位置

我正在尝试在（6X3）网格上创建子图。我对图例的位置有问题。图例对所有子情节都是通用的。lgend 现在与 y 轴标签重叠

我尝试删除 constrained_layout=True 选项。但这在图例和子图之间保留了很多空白。

import numpy as np
import matplotlib.pyplot as plt
#plt.rcParams["font.family"] = "Times New Roman"
#plt.rcParams.update({'font.size': 12})

font = {'family' : 'Times New Roman',
        'size'   : 14}  
plt.rc('font', **font)


t = np.linspace(0,10, num=200)
fig, axs = plt.subplots(6, 3, figsize=(12,16))#, constrained_layout=True)
i = 0 # i = 0 for x = 0.25; i = 3 for x = -0.25
j = 6 # j = 6 for x = 0.25; j = 9 for x = …

Run Code Online (Sandbox Code Playgroud)

matplotlib

use*_*033

2019 04-02

3
推荐指数

1
解决办法

4198
查看次数

Julia中的调试选项

我在原子ide中使用Juno包来调试Julia代码.我怎样才能进入这个功能？该函数从不同的文件导入.我可以通过选择它们然后按"ctrl + enter"来执行一组行.是否有任何捷径进入函数并在函数中逐行执行.谢谢.是否可以使用gdb调试Julia代码？谢谢.

debugging gdb julia

use*_*033

lucky-day

2
推荐指数

1
解决办法

324
查看次数

基于输入数据的Keras中的自定义损失函数

我正在尝试使用Keras创建自定义损失函数。我想根据输入来计算损失函数并预测神经网络的输出。

我尝试在Keras中使用customloss函数。我认为y_true是我们为训练提供的输出，而y_pred是神经网络的预测输出。以下损失函数与Keras中的“ mean_squared_error”损失相同。

def customloss(y_true, y_pred):
    return K.mean(K.square(y_pred - y_true), axis=-1)

Run Code Online (Sandbox Code Playgroud)

除了mean_squared_error损失，我还想使用神经网络的输入来计算自定义损失函数。有没有一种方法可以将输入作为自定义函数的参数发送到神经网络。

谢谢。

keras

use*_*033

lucky-day

0
推荐指数

2
解决办法

1888
查看次数

标签统计

debugging ×1

gdb ×1

julia ×1

keras ×1

matplotlib ×1

python ×1

ray ×1

reinforcement-learning ×1

rllib ×1

RLlib 训练一次迭代中的时间步数

matplotlib 子图中的图例位置

Julia中的调试选项

基于输入数据的Keras中的自定义损失函数

标签 统计

小编use_033的帖子

标签统计