Tae*_*Kim 3 inference difference tensorflow
我是 tensorflow 的初学者。我想通过使用本教程来研究 tensorflow 。
阅读本教程后,我想通过使用我的数据(用于标记化的韩国标题)运行此代码在训练模型(使用TrainingHelper)中,预测结果似乎还可以。但是在推理模型(使用GreedyEmbeddingHelper)中,预测结果非常糟糕(即使使用训练数据)。看起来像first epoch的训练模型预测。有什么区别TrainingHelper和GreedyEmbeddingHelper?
我认为教程和我的代码之间的区别只是超参数。
TrainingHelper 用于训练时,此时解码器 RNN 的(其中一个)输入是来自上一个时间步的基本事实。由于在推理时无法获得地面实况,因此您可以输入上一时间步的解码器输出。
例如,考虑目标句子“我喜欢披萨”。在训练时,在解码单词“pizza”时,解码 RNN 将收到以下输入:
在推理时,解码 RNN 仍将接收 2 和 3。然而,它会从前一个时间步长(一个等于目标词汇长度的单热编码,例如你的解码器在上一个时间步骤猜测的词),通过目标嵌入运行它,并将其用作输入。
| 归档时间: |
|
| 查看次数: |
1227 次 |
| 最近记录: |