使用 Tensorflow 2.0 和没有 Keras 的急切执行

And*_*vad 8 python keras tensorflow mlp eager-execution

所以这个问题可能源于缺乏对张量流的了解。但是我正在尝试使用 构建一个多层感知器tensorflow 2.0,但没有Keras.

原因是我的机器学习课程要求我们不使用 keras。你为什么会问?我不确定。

我已经tensorflow 2.0用 Keras 轻松实现了我们的模型,现在我想在没有keras.

model = Sequential()
model.add(Dense(64, activation='relu', input_dim=784))
model.add(Dropout(0.5))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(5, activation='softmax'))

sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='categorical_crossentropy',
              optimizer=Adam(),
              metrics=['accuracy'])

X_train = X[:7000]
y_train = tf.keras.utils.to_categorical(y[:7000], num_classes=5)
X_dev = X[7000:]
y_dev = tf.keras.utils.to_categorical(y[7000:], num_classes=5)

model.fit(X_train, y_train,
          epochs=100,
          batch_size=128)
score = model.evaluate(X_dev, y_dev, batch_size=128)
print(score)
Run Code Online (Sandbox Code Playgroud)

这是我的问题。每当我在 上查找文档时Tensorflow 2.0,甚至自定义培训的指南都在使用 Keras。

由于占位符和会话在tensorflow 2.0.

我可以制作张量对象。我的印象是我需要使用 Eager Execution 并使用渐变磁带。但是我仍然不确定如何将这些东西放在一起。

现在我的问题是。我应该在哪里寻找更好的理解?哪个方向下降最大?

请告诉我我是否做错了这个堆栈溢出帖子。这是我第一次来这里。

Rod*_*iro 0

正如 @Daniel M\xc3\xb6ller 所说,有这些用于自定义训练自定义层的教程正如 @Daniel M\xc3\xb6ller 所说,官方 TensorFlow 页面上如自定义培训页面所述:

\n
\n

本教程使用了tf.Variable构建和训练简单的线性模型。

\n
\n

还有一个博客可以在没有 Keras API 的情况下创建自定义层和训练。你可以检查这个代码,该代码使用带有自定义层的 Cifar-10 并以相同的方式进行训练。

\n