viv*_*a70 15 python reinforcement-learning keras tensorflow keras-rl
我正在尝试在 openAI 健身房的一款游戏上实现 DQL 模型。但它给了我以下错误。
TypeError: len 没有为符号张量很好地定义。(activation_3/Identity:0) 请致电
x.shape而不是len(x)获取形状信息。
营造健身房环境:
ENV_NAME = 'CartPole-v0'
env = gym.make(ENV_NAME)
np.random.seed(123)
env.seed(123)
nb_actions = env.action_space.n
Run Code Online (Sandbox Code Playgroud)
我的模型看起来像这样:
model = Sequential()
model.add(Flatten(input_shape=(1,) + env.observation_space.shape))
model.add(Dense(16))
model.add(Activation('relu'))
model.add(Dense(nb_actions))
model.add(Activation('linear'))
print(model.summary())
Run Code Online (Sandbox Code Playgroud)
将该模型拟合到来自 keral-rl 的 DQN 模型,如下所示:
policy = EpsGreedyQPolicy()
memory = SequentialMemory(limit=50000, window_length=1)
dqn = DQNAgent(model=model, nb_actions=nb_actions, memory=memory, nb_steps_warmup=10, target_model_update=0.001, policy=policy)
dqn.compile(Adam(lr=1e-3), metrics=['mse', 'mae'])
dqn.fit(env, nb_steps=5000, visualize=False, verbose=3)
Run Code Online (Sandbox Code Playgroud)
错误来自这一行:
dqn = DQNAgent(model=model, nb_actions=nb_actions, memory=memory, nb_steps_warmup=10, target_model_update=0.001, policy=policy)
Run Code Online (Sandbox Code Playgroud)
我正在使用 keras-rl==0.4.2 和 tensorflow==2.1.0。根据其他答案,我也尝试了 tensorflow==2.0.0-beta0 但它没有解决错误。
有人可以向我解释为什么我面临这个错误吗?以及如何解决?
谢谢你。
| 归档时间: |
|
| 查看次数: |
5645 次 |
| 最近记录: |