Soh*_*ham 5 python reinforcement-learning deep-learning keras
我正在学习这个强化学习教程 ,到目前为止它真的很棒,但有人可以解释一下吗
newQ = model.predict(new_state.reshape(1,64), batch_size=1)
Run Code Online (Sandbox Code Playgroud)
和
model.fit(X_train, y_train, batch_size=batchSize, nb_epoch=1, verbose=1)
Run Code Online (Sandbox Code Playgroud)
意思?
至于在什么做的论点bach_size,nb_epoch和verbose做什么?我知道神经网络,所以用它来解释会很有帮助。
您还可以向我发送一个链接,其中可以找到这些函数的文档。
首先让我惊讶的是你找不到文档,但我猜你在搜索时运气不好。
文档说明model.fit:
fit(self, x, y, batch_size=32, nb_epoch=10, verbose=1, callbacks=[], validation_split=0.0, validation_data=None, shuffle=True, class_weight=None, sample_weight=None)
batch_size: 整数。每次梯度更新的样本数。nb_epoch:整数,迭代训练数据数组的次数。verbose: 0、1 或 2。详细模式。0 = 无声,1 = 冗长,2 = 每个 epoch 一个日志行。
batch_size情况下的参数model.predict只是用于每个预测步骤的样本数。所以调用model.predict一次会消耗batch_size大量的数据样本。这有助于可以快速处理大型矩阵的设备(例如 GPU)。
| 归档时间: |
|
| 查看次数: |
41496 次 |
| 最近记录: |