变分自动编码器损失函数（keras）

Question

变分自动编码器损失函数（keras）

Vin*_*sse 5 python python-3.x autoencoder keras loss-function

我正在使用 Keras 构建一个变分自动编码器。我很大程度上受到@Fchollet 示例的启发：https : //github.com/fchollet/keras/blob/master/examples/variational_autoencoder.py

但我正在处理连续数据。我的输出是一个持续时间，而不是像 MNIST 那样对数字进行排名。在这方面，我将损失函数从 binary_crossentropy 更改为 mean_squared_error。我主要想知道第二项，即 KL 散度。它应该适用于连续数据吗？我无法绕过它。对我来说，它应该将相似的数据紧密地放在潜在空间中。例如，在 MNIST 数据的 cas 中，将每个“1”放在潜在空间中，将每个“2”放在一起等等......因为我正在处理连续数据，它是如何工作的？在我的情况下有更好的丢失功能吗？

这是丢失的功能：

def vae_loss(x, x_decoded_mean):
    xent_loss = original_dim *metrics.mean_squared_error(x, x_decoded_mean)
    kl_loss = - 0.5 * K.mean(1 + z_log_sigma - K.square(z_mean) - K.exp(z_log_sigma), axis=-1)
    return K.mean(xent_loss + kl_loss)
vae.compile(optimizer='Adam', loss=vae_loss)

Run Code Online (Sandbox Code Playgroud)

这是 3D 潜在空间中的表示。

如您所见，一些类似的数据会根据需要放在一起。当我将 kl_loss 函数的系数增加到 "-100000" 而不是 "-0.5" 时会发生以下情况：

我以为我会以几乎线性的方式从蓝色变为红色。相反，我以混乱的方式获得了所有数据的集群。

你们能帮帮我吗？谢谢！

Answer 1

小智 0

在我看来，这是因为你通过增加 KL 损失的系数来增加其重要性。换句话说，损失函数更多地“照顾”KL 项。请记住，KL 损失用于“获取”具有先验 N(0,1) 的后验分布。因此，如果你大量“扩展”这种行为（用一个大的系数），每个数据的分布都会收敛到这个分布==>所有数据的后验均值为0并且数据一起推向0==>你的潜在表示:)

归档时间：	8 年前
查看次数：	2426 次
最近记录：	7 年，5 月前