Jam*_*man 4 nlp machine-learning deep-learning recurrent-neural-network rnn
我一直在研究使用 RNN 生成文本,似乎常用的技术是逐个字符输入文本,然后让 RNN 预测下一个字符。
为什么不使用相同的技术,而是使用单词而不是字符。这对我来说似乎是一种更好的技术,因为 RNN 不会犯任何错别字,而且训练速度会更快。
我错过了什么吗?
此外,是否可以创建一个单词预测 RNN,但以某种方式输入在 word2vec 上预先训练的单词,以便 RNN 可以理解它们的含义?
为什么不使用相同的技术,而是使用单词而不是字符。
基于单词的模型与基于字符的模型一样经常使用。请参阅此问题中的示例。但是两者之间有几个重要的区别:
顺便说一句,还有子词模型,有点中间。请参阅T. Mikolov 等人的“使用神经网络进行子词语言建模”。
此外,是否可以创建一个单词预测 RNN,但以某种方式输入在 word2vec 上预训练的单词,以便 RNN 可以理解它们的含义?
是的,我上面提到的例子正是关于这种模型的。
归档时间: |
|
查看次数: |
2019 次 |
最近记录: |