我正在学习使用 keras 构建自定义的序列到序列模型,并且一直在阅读其他人编写的一些代码,例如这里。我对有关常量的调用方法感到困惑。有 keras “关于将外部常量传递给 RNN 的注意事项”,但是我无法理解常量对模型的作用。
我确实浏览了注意力模型和指针网络论文,但也许我错过了一些东西。
对建模细节的任何参考将不胜感激!提前致谢。
python keras rnn
keras ×1
python ×1
rnn ×1