我对 TensorFlow 和 LSTM 架构相当陌生。我在计算数据集的输入和输出(x_train、x_test、y_train、y_test)时遇到问题。
我输入的原始形状:
y_train 和 y_test 是一系列股票价格。x_train 和 x_test 是我想用来预测股票价格的四个特征。
# Splitting the training and testing data
train_start_date = '2010-01-08'
train_end_date = '2017-01-06'
test_start_date = '2017-01-13'
test_end_date = '2019-01-04'
train = df.ix[train_start_date : train_end_date]
test = df.ix[test_start_date:test_end_date]
X_test = sentimentScorer(test)
X_train = sentimentScorer(train)
Y_test = test['prices']
Y_train = train['prices']
#Conversion in 3D array for LSTM INPUT
X_test = X_test.reshape(1, 104, 4)
X_train = X_train.reshape(1, 366, 4)
model = Sequential()
model.add(LSTM(128, input_shape=(366,4), activation='relu',
return_sequences=True)) …Run Code Online (Sandbox Code Playgroud) 所以基本上我有一个元组列表[(a,b)],我必须从中做一些过滤.一个工作是删除反转的重复项,以便如果列表中存在(a,b)和(b,a),我只采用它们的一个实例.但列表理解并不是很有帮助.如何以有效的方式解决这个问题?
谢谢