我正在学习 Tensorflow,并且遇到了张量流中的嵌入层,用于学习自己的词嵌入。该层采用以下参数:
keras.layers.Embedding(input_dim,
output_dim,
embeddings_initializer='uniform',
embeddings_regularizer=None,
activity_regularizer=None,
embeddings_constraint=None,
mask_zero=False,
input_length=None)
Run Code Online (Sandbox Code Playgroud)
“输入暗淡”应该与词汇表(即独特的单词)大小相同。如果我想将词汇量限制为仅前 25000 个最常见的单词 - 我应该怎么做?
我可以简单地将 'input_dim' 更改为 25000 还是我必须浏览我的语料库并用标记替换前 25000 个单词之外的任何单词?