小编kos*_*osa的帖子

使用 TFagents 的自定义环境

我正在尝试使用 TFAgents 包学习自定义环境。我正在关注机器学习手册(colab 中的代码,请参阅单元格 129)。我的目标是在自定义编写的网格世界环境中使用 DQN 代理。

网格世界环境:

class MyEnvironment(tf_agents.environments.py_environment.PyEnvironment):

def __init__(self, discount=1.0):
    super().__init__()
    self.discount = discount

    self._action_spec = tf_agents.specs.BoundedArraySpec(shape=(), dtype=np.int32, name="action", minimum=0, maximum=3)
    self._observation_spec = tf_agents.specs.BoundedArraySpec(shape=(4, 4), dtype=np.int32, name="observation", minimum=0, maximum=1)


def action_spec(self):
    return self._action_spec

def observation_spec(self):
    return self._observation_spec

def _reset(self):
    self._state = np.zeros(2, dtype=np.int32)
    obs = np.zeros((4, 4), dtype=np.int32)
    obs[self._state[0], self._state[1]] = 1
    return tf_agents.trajectories.time_step.restart(obs)

def _step(self, action):
    self._state += [(-1, 0), (+1, 0), (0, -1), (0, +1)][action]
    reward = 0
    obs = np.zeros((4, 4), dtype=np.int32) …
Run Code Online (Sandbox Code Playgroud)

reinforcement-learning keras tensorflow

2
推荐指数
1
解决办法
610
查看次数

标签 统计

keras ×1

reinforcement-learning ×1

tensorflow ×1