小编one*_*rtz的帖子

我大致遵循了本教程：

一个显着的区别是，我使用2个LSTM层与辍学。我的数据集是不同的（音乐数据集是abc表示法）。我确实生成了一些歌曲，但是在生成过程中经过一定数量的步骤（可能从30步到几百步）之后，LSTM不断重复生成完全相同的序列。例如，它曾经陷入了为歌曲生成URL的困境：

等等 ...

它曾经一度被困于生成相同的两首歌（这两首歌是大约300个字符的序列）。在开始时，它产生了3-4个好的乐曲，但是之后，它几乎无限地保持了两首歌曲的再生。

我想知道，是否有人对可能发生的事情有所了解？

我想澄清的是，无论是重复还是不重复，生成的任何序列似乎都是新的（模型没有记忆性）。验证损失和培训损失按预期减少。Andrej Karpathy能够生成包含数千个字符的文档，但我找不到这种无限期卡住的模式。

6
推荐指数

1
解决办法

1836
查看次数

小编one_rtz的帖子