Keras LSTM在CPU上比GPU快吗？

Question

Keras LSTM在CPU上比GPU快吗？

Geo*_*lia 7 performance theano lstm keras

我正在Keras上测试LSTM网络，并且在CPU（i2600k 16GB上为5秒/纪元）上的训练比在GPU（Nvidia 1060 6GB上为35秒）上的训练要快得多。GPU利用率大约为15％，而尝试包括Keras示例在内的其他LSTM网络时，我从未见过超过30％。当我运行其他类型的网络MLP和CNN时，GPU更快。我正在使用最新的theano 0.9.0dev4和keras 1.2.0

该序列具有3个输入（整数）的50,000个时间步。

如果输入是降序（3,2,1），则输出为0，如果是升序，则输出为1，除非最后两个输入也都升序，则输出为0而不是1。

250个纪元后，我获得了99.97％的精度，但是为什么GPU这么慢？我在模型中做错了吗？我尝试了各种批处理设置，但仍然遇到相同的问题。

def generate_data():
    X=[]
    Y=[]
    for i in range(50000):
        start=random.randint(1,100)
        d=random.randrange(-1,2,2) #-1 or 1
        param=[(start),(start+d),(start+d+d)]
        X.append(np.array(param))
        if d<0:
            Y.append([1,0])

        elif len(Y)>2 and d>0 and Y[-1][1]==1 and Y[-2][1]==1:
            Y.append([1,0])
        elif d>0:
            Y.append([0,1])
    X=np.array(X)
    Y=np.array(Y)
    return X,Y
X,Y = generate_data()
X=np.asarray(X,'float32')
Y=np.asarray(Y,'float32')
X=np.reshape(X,(1,len(X),3))
Y=np.reshape(Y,(1,len(Y),2))

model=Sequential()
model.add(LSTM(20, input_shape=(50000,3), return_sequences=True))
model.add(Dense(2))
model.add(Activation('softmax'))

model.compile(loss='categorical_crossentropy', optimizer=RMSprop(), metrics=['accuracy'])
history = model.fit(X, Y,batch_size=100, nb_epoch=250, verbose=2)

Run Code Online (Sandbox Code Playgroud)

有什么想法吗？谢谢！

Answer 1

Roy*_*rot 9

使用Keras的CuDNNLSTM单元在Nvidia GPU上加速计算：https : //keras.io/layers/recurrent/#cudnnlstm

只是将LSTM行更改为：

model.add(CuDNNLSTM(20, input_shape=(50000,3), return_sequences=True))

Run Code Online (Sandbox Code Playgroud)

但不幸的是，没有 recurrent_dropout。 (2认同)

归档时间：	8 年，11 月前
查看次数：	3545 次
最近记录：	7 年，10 月前