hak*_*rus 11 python reinforcement-learning keras tensorflow
我试图在keras模型中使用huber loss(编写DQN),但是我的结果很糟糕,我认为我做错了.我的代码如下.
model = Sequential()
model.add(Dense(output_dim=64, activation='relu', input_dim=state_dim))
model.add(Dense(output_dim=number_of_actions, activation='linear'))
loss = tf.losses.huber_loss(delta=1.0)
model.compile(loss=loss, opt='sgd')
return model
Run Code Online (Sandbox Code Playgroud)
小智 15
您可以在自定义Keras损失函数中包含Tensorflow的Huber损失,然后将其传递给您的模型.
def get_huber_loss_fn(**huber_loss_kwargs):
def custom_huber_loss(y_true, y_pred):
return tf.losses.huber_loss(y_true, y_pred, **huber_loss_kwargs)
return custom_huber_loss
# Later...
model.compile(
loss=get_huber_loss_fn(delta=0.1)
...
)
Run Code Online (Sandbox Code Playgroud)
我是带着完全相同的问题来到这里的。可接受的答案使用的logcosh属性可能相似,但并不完全是Huber Loss。这是我为Keras实施Huber Loss的方式(请注意,我使用的是Tensorflow 1.5中的Keras)。
import numpy as np
import tensorflow as tf
'''
' Huber loss.
' https://jaromiru.com/2017/05/27/on-using-huber-loss-in-deep-q-learning/
' https://en.wikipedia.org/wiki/Huber_loss
'''
def huber_loss(y_true, y_pred, clip_delta=1.0):
error = y_true - y_pred
cond = tf.keras.backend.abs(error) < clip_delta
squared_loss = 0.5 * tf.keras.backend.square(error)
linear_loss = clip_delta * (tf.keras.backend.abs(error) - 0.5 * clip_delta)
return tf.where(cond, squared_loss, linear_loss)
'''
' Same as above but returns the mean loss.
'''
def huber_loss_mean(y_true, y_pred, clip_delta=1.0):
return tf.keras.backend.mean(huber_loss(y_true, y_pred, clip_delta))
Run Code Online (Sandbox Code Playgroud)
根据您是要减少损失还是减少损失的平均值,请使用上面的相应功能。
| 归档时间: |
|
| 查看次数: |
9070 次 |
| 最近记录: |