标签: recurrent-neural-network

Keras中具有批量归一化的双向LSTM

我想知道如何在Keras中实现具有批量标准化(BN)的biLSTM.我知道BN层应该在线性和非线性之间,即激活.使用CNN或Dense图层很容易实现.但是,如何用biLSTM做到这一点？

提前致谢.

python lstm keras recurrent-neural-network keras-layer

abo*_*azl

2018 05-11

9
推荐指数

1
解决办法

5838
查看次数

LSTM遵循均值池

我正在使用Keras 1.0.我的问题与此问题相同(如何在Keras中实现Mean Pooling层),但对我来说这里的答案似乎不够.

我想实现这个网络:

以下代码不起作用:

sequence = Input(shape=(max_sent_len,), dtype='int32')
embedded = Embedding(vocab_size, word_embedding_size)(sequence)
lstm = LSTM(hidden_state_size, activation='sigmoid', inner_activation='hard_sigmoid', return_sequences=True)(embedded)
pool = AveragePooling1D()(lstm)
output = Dense(1, activation='sigmoid')(pool)

Run Code Online (Sandbox Code Playgroud)

如果我没有设置return_sequences=True,我打电话时会收到此错误AveragePooling1D():

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/PATH/keras/engine/topology.py", line 462, in __call__
    self.assert_input_compatibility(x)
  File "/PATH/keras/engine/topology.py", line 382, in assert_input_compatibility
    str(K.ndim(x)))
Exception: ('Input 0 is incompatible with layer averagepooling1d_6: expected ndim=3', ' found ndim=2')

Run Code Online (Sandbox Code Playgroud)

否则,我打电话时会收到此错误Dense():

Traceback (most recent call last):
  File …

Run Code Online (Sandbox Code Playgroud)

machine-learning neural-network deep-learning keras recurrent-neural-network

mos*_*aab

2017 07-10

8
推荐指数

2
解决办法

6767
查看次数

Tensorflow动态RNN(LSTM):如何格式化输入？

我收到了一些这种格式的数据和以下细节:

person1, day1, feature1, feature2, ..., featureN, label
person1, day2, feature1, feature2, ..., featureN, label
...
person1, dayN, feature1, feature2, ..., featureN, label
person2, day1, feature1, feature2, ..., featureN, label
person2, day2, feature1, feature2, ..., featureN, label
...
person2, dayN, feature1, feature2, ..., featureN, label
...

Run Code Online (Sandbox Code Playgroud)

总是有相同数量的功能,但每个功能可能是0表示什么都没有
每个人都有不同的天数,例如,person1有20天的数据,person2有50天

目标是预测第二天的人的标签,因此dayN + 1的标签,无论是基于每个人还是整体(每个人对我更有意义).我可以自由地重新格式化数据(它不是很大).基于上面的一些阅读之后,我认为动态RNN(LSTM)可能效果最好:

反复神经网络:因为第二天依赖于前一天
lstm:因为模型每天都会建立起来
动态:因为并非每天都有所有功能

如果对我的数据没有意义,请在这里阻止我.问题是:

如何为tensorflow/tflearn提供/格式化这些数据？

我使用tflearn 查看了这个例子,但是我不理解它的输入格式,所以我可以"镜像"它到我的.同样地,在一个非常相似的问题上找到了这篇文章,但看起来海报所拥有的样本彼此之间没有相关性,因为它们在我的中.我对tensorflow的体验仅限于其入门页面.

python lstm tensorflow recurrent-neural-network tflearn

Dim*_*bag

2017 05-23

8
推荐指数

1
解决办法

9449
查看次数

Keras SimpleRNN 的参数数量

我有一个SimpleRNN喜欢：

model.add(SimpleRNN(10, input_shape=(3, 1)))
model.add(Dense(1, activation="linear"))

Run Code Online (Sandbox Code Playgroud)

模型摘要说：

simple_rnn_1 (SimpleRNN)   (None, 10)   120

Run Code Online (Sandbox Code Playgroud)

我很好奇的参数个数120为simple_rnn_1。

有人能回答我的问题吗？

machine-learning neural-network deep-learning keras recurrent-neural-network

you*_*ark

2021 02-24

8
推荐指数

2
解决办法

3843
查看次数

我们如何在 Keras 中定义一对一、一对多、多对一和多对多 LSTM 神经网络？

我正在阅读这篇文章（The Unreasonable Effectiveness of Recurrent Neural Networks），想了解如何在 Keras 中表达一对一、一对多、多对一和多对多 LSTM 神经网络. 我已经阅读了很多关于 RNN 并了解 LSTM NN 的工作原理，特别是消失梯度、LSTM 单元、它们的输出和状态、序列输出等。但是，我无法在 Keras 中表达所有这些概念。

首先，我使用 LSTM 层创建了以下玩具神经网络

from keras.models import Model
from keras.layers import Input, LSTM
import numpy as np

t1 = Input(shape=(2, 3))
t2 = LSTM(1)(t1)
model = Model(inputs=t1, outputs=t2)

inp = np.array([[[1,2,3],[4,5,6]]])
model.predict(inp)

Run Code Online (Sandbox Code Playgroud)

输出：

array([[ 0.0264638]], dtype=float32)

Run Code Online (Sandbox Code Playgroud)

在我的示例中，我的输入形状为 2 x 3。据我所知，这意味着输入是 2 个向量的序列，每个向量具有 3 个特征，因此我的输入必须是 shape 的 3D 张量(n_examples, 2, 3)。在'sequences'方面，输入是一个长度为2的序列，该序列中的每个元素用3个特征表示（如有错误请指正）。当我打电话predict它时，它会返回一个带有单个标量的 2 维张量。所以，

Q1：是一对一的还是其他类型的LSTM网络？

当我们说“一个/多个输入和一个/多个输出”时

Q2：我们所说的“一个/多个输入/输出”是什么意思？“一个/多个”标量、向量、序列……，一个/多个什么？ …

python neural-network lstm keras recurrent-neural-network

fad*_*ack

2018 09-03

8
推荐指数

1
解决办法

1万
查看次数

keras GRU 层中的返回状态和返回序列有什么区别？

我似乎无法理解 keras GRU 层中返回状态和返回序列之间的差异。

由于 GRU 单元没有单元状态（它等于输出），返回状态与 keras GRU 层中的返回序列有何不同？

更具体地说，我构建了一个编码器-解码器 LSTM 模型，其中包含一个编码器层和一个解码器层。编码器层返回其状态(return_state = TRUE)，解码器层使用这些状态作为初始状态(initial_state = encoder_states)。

当尝试使用 GRU 层执行此操作时，我不明白在编码器和解码器层之间传递了什么状态。如果你能澄清这一点，请告诉我。提前致谢。

machine-learning lstm keras tensorflow recurrent-neural-network

Sta*_*low

2019 02-26

8
推荐指数

1
解决办法

2004
查看次数

为什么为 tf.keras.layers.LSTM 设置 return_sequences=True 和 stateful=True？

我正在学习 tensorflow2.0 并按照教程进行操作。在rnn示例中，我找到了代码：

def build_model(vocab_size, embedding_dim, rnn_units, batch_size):
  model = tf.keras.Sequential([
    tf.keras.layers.Embedding(vocab_size, embedding_dim, 
                              batch_input_shape=[batch_size, None]),
    tf.keras.layers.LSTM(rnn_units, 
                        return_sequences=True, 
                        stateful=True, 
                        recurrent_initializer='glorot_uniform'),
    tf.keras.layers.Dense(vocab_size)
  ])
  return model

Run Code Online (Sandbox Code Playgroud)

我的问题是：为什么代码设置了参数return_sequences=True和stateful=True？如何使用默认参数？

lstm keras tensorflow recurrent-neural-network

tid*_*idy

lucky-day

8
推荐指数

3
解决办法

4138
查看次数