在自定义层中禁用了 Tensorflow 2 急切执行

Question

在自定义层中禁用了 Tensorflow 2 急切执行

Kle*_*ios 5 python tensorflow eager-execution tensorflow2.0

我在 ubuntu 18.04 盒子中使用通过 pip 安装的 TF2

$ pip freeze | grep "tensorflow"
tensorflow==2.0.0
tensorflow-estimator==2.0.1

Run Code Online (Sandbox Code Playgroud)

我正在玩一个自定义层。

import tensorflow as tf
from tensorflow.keras.preprocessing import sequence
from tensorflow.keras.layers import Input, Concatenate, Dense, Bidirectional, LSTM, Embedding
from tensorflow.keras.models import Model
from tensorflow.keras.datasets import imdb

class Attention(tf.keras.layers.Layer):

    def __init__(self, units):
        super(Attention, self).__init__()
        self.W1 = Dense(units)
        self.W2 = Dense(units)
        self.V = Dense(1)

    def call(self, features, hidden):
        hidden_with_time_axis = tf.expand_dims(hidden, 1)
        score = tf.nn.tanh(self.W1(features) + self.W2(hidden_with_time_axis))
        attention_weights = tf.nn.softmax(self.V(score), axis=1)
        context_vector = attention_weights * features
        context_vector = tf.reduce_sum(context_vector, axis=1)

        return context_vector, attention_weights

vocab_size = 10000

(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=vocab_size)

max_len = 200
rnn_cell_size = 128

x_train = sequence.pad_sequences(x_train, maxlen=max_len, padding='post')
x_test = sequence.pad_sequences(x_test, maxlen=max_len, truncating='post', padding='post')

# Network

sequence_input = Input(shape=(max_len,), dtype='int32')

embedded_sequences = Embedding(vocab_size, 128, input_length=max_len)(sequence_input)

# lstm = Bidirectional(LSTM(rnn_cell_size, dropout=0.3, return_sequences=True, return_state=True), name="bi_lstm_0")(embedded_sequences)

lstm, forward_h, forward_c, backward_h, backward_c = Bidirectional(LSTM(rnn_cell_size, dropout=0.2, return_sequences=True, return_state=True))(embedded_sequences)

state_h = Concatenate()([forward_h, backward_h])
state_c = Concatenate()([forward_c, backward_c])

attention = Attention(8)

context_vector, attention_weights = attention(lstm, state_h)

output = Dense(1, activation='sigmoid')(context_vector)

model = Model(inputs=sequence_input, outputs=output)

# summarize layers
print(model.summary())

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

history = model.fit(x_train, y_train, epochs=10, batch_size=200, validation_split=.3, verbose=1)

result = model.evaluate(x_test, y_test)
print(result)

Run Code Online (Sandbox Code Playgroud)

我想调试/检查Attention.call()函数，但是当在函数内部设置断点时，我无法获取张量值。

在我开始 .fit() 之前，我可以验证 Eager Execution 是否已启用

print(tf.executing_eagerly())
True

Run Code Online (Sandbox Code Playgroud)

但是在 Attention.call() 函数内部，急切执行被禁用

print(tf.executing_eagerly())
False

Run Code Online (Sandbox Code Playgroud)

在 call() 执行期间急切执行的任何原因是假的？如何启用它？

Answer 1

don*_*njy 5

默认情况下，tf.keras模型被编译为静态图以提供最佳执行性能。想想这@tf.function是默认为tf.keras模型注释的。

https://www.tensorflow.org/api_docs/python/tf/keras/Model#run_eagerly

要为tf.keras模型显式启用 Eager 模式，请在您的代码中使用run_eagerly=True.

model.compile(optimizer='adam', run_eagerly = True, loss='binary_crossentropy', metrics=['accuracy'])

归档时间：	5 年，12 月前
查看次数：	1741 次
最近记录：	5 年，12 月前