Keras - 自定义损失函数/访问张量的第 75 个百分位元素

ate*_*ter 6 python sequential keras tensorflow loss-function

我正在尝试为 Keras 中的模型实现一个稍微修改的二元交叉熵损失函数。在 Keras 中，binary_crossentropy 定义为：

def binary_crossentropy(y_true, y_pred):
  return K.mean(K.binary_crossentropy(y_true, y_pred), axis=-1)

Run Code Online (Sandbox Code Playgroud)

我拥有的数据是分组的（即有一列指示 group1、group2 等）但每个组的行数不同（即 group1 有 52 个观察值，group2 有 101 个观察值等）。

理想情况下，我想找到每个组的平均二元交叉熵，并返回最大平均二元交叉熵（最大的平均二元交叉熵，按组）。

似乎没有使用组的任何现成的解决方案，我无法想出一个解决方案。关于观察属于哪个组的信息会丢失，并且不会传递到 y_true 和 y_pred，而且我不确定 k-fold cv 将如何准确地改变作为 y_true 和 y_pred 传递的观察值/数量。如果有办法通过 Sequential 模型保留组信息，那可能就是解决方案。代码将完成类似的事情：

def custom_loss(y_true, y_pred):
  max_bc = []
  for group in groups:
     max_bc += [K.mean(K.binary_crossentropy(y_true, y_pred), axis=-1)]
  return max_bc

Run Code Online (Sandbox Code Playgroud)

如果上述方法不可行，另一种度量可能是张量的第 75 个百分位值。就像是：
def custom_loss(y_true, y_pred):
  return K.binary_crossentropy(y_true, y_pred)[len(y_true)*0.75]
Run Code Online (Sandbox Code Playgroud)
但我确信这是错误的——我只是对 Keras 和 Tensorflow 不够熟悉，无法获得正确的代码。

编辑：我可能刚刚找到了一种方法来做百分位数，但结果并不如预期......对第一部分有所了解仍然很棒。

def custom_loss(y_true, y_pred):
  e = K.binary_crossentropy(y_true,y_pred)
  return distributions.percentile(e, q=75.)

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，8 月前
查看次数：	588 次
最近记录：	7 年，8 月前