Tensorflow embedding_lookup

nic*_*vid 6 python machine-learning python-2.7 tensorflow word-embedding

我试图通过TensorFlow tf.nn.embedding_lookup()函数"从头开始"学习imdb数据集的单词表示.如果我理解正确,我必须在另一个隐藏层之前设置一个嵌入层,然后当我执行渐变下降时,该层将"学习"该层权重中的一个单词表示.但是,当我尝试这样做时,我的嵌入层和网络的第一个完全连接层之间出现了形状错误.

def multilayer_perceptron(_X, _weights, _biases):
    with tf.device('/cpu:0'), tf.name_scope("embedding"):
        W = tf.Variable(tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0),name="W")
        embedding_layer = tf.nn.embedding_lookup(W, _X)    
    layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(embedding_layer, _weights['h1']), _biases['b1'])) 
    layer_2 = tf.nn.sigmoid(tf.add(tf.matmul(layer_1, _weights['h2']), _biases['b2'])) 
    return tf.matmul(layer_2, weights['out']) + biases['out']

x = tf.placeholder(tf.int32, [None, n_input])
y = tf.placeholder(tf.float32, [None, n_classes])

pred = multilayer_perceptron(x, weights, biases)
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(pred,y))
train_step = tf.train.GradientDescentOptimizer(0.3).minimize(cost)

init = tf.initialize_all_variables()
Run Code Online (Sandbox Code Playgroud)

我得到的错误是:

ValueError: Shapes TensorShape([Dimension(None), Dimension(300), Dimension(128)])
and TensorShape([Dimension(None), Dimension(None)]) must have the same rank
Run Code Online (Sandbox Code Playgroud)

mrr*_*rry 17

形状误差的产生是因为您使用二维张量,x索引到二维嵌入张量W.想想tf.nn.embedding_lookup()(及其近亲tf.gather())的每个取整数值ix与该行替换它W[i, :].从错误消息中,可以推断出n_input = 300embedding_size = 128.通常,tf.nn.embedding_lookup()维数的结果等于rank(x) + rank(W) - 1......在这种情况下,3.当您尝试将此结果乘以_weights['h1'](二维)矩阵时,会出现错误.

要修复此代码,它取决于您要执行的操作,以及为什么要将输入矩阵传递给嵌入.一个常见的事情是使用类似的操作将每个输入示例的嵌入向量聚合为每个示例的单行tf.reduce_sum().例如,您可以执行以下操作:

W = tf.Variable(
    tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0) ,name="W")
embedding_layer = tf.nn.embedding_lookup(W, _X)

# Reduce along dimension 1 (`n_input`) to get a single vector (row)
# per input example.
embedding_aggregated = tf.reduce_sum(embedding_layer, [1])

layer_1 = tf.nn.sigmoid(tf.add(tf.matmul(
    embedding_aggregated, _weights['h1']), _biases['b1'])) 
Run Code Online (Sandbox Code Playgroud)

  • 你是对的错误 - 纠正它,谢谢!我选择沿着'n_input`维度减少,因为它似乎更可能与你的问题相匹配,我认为(例如)输入的顺序并不重要.对于词袋类型的问题,这是相当典型的.你*可以*沿'embedding_size`减少,但我认为这会从嵌入中丢失很多信息,所以它可能不会有效. (2认同)