import pandas as pd
import numpy as np
rands = np.random.random(7)
days = ['Sunday', 'Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday']
dates = pd.date_range('2018-01-01', '2018-01-07')
df = pd.DataFrame({'date': dates, 'days': days, 'y': rands})
df_days_onehot = pd.get_dummies(df.days)[days]
df[days] = df_days_onehot
df['target'] = df.y.shift(-1)
df.drop('days', axis=1, inplace=True)
df.set_index('date', inplace=True)
X = df.iloc[:, :-1].values
y = df.iloc[:, -1].values
Run Code Online (Sandbox Code Playgroud)
我在上面共享了一个代码示例。我的问题是如何将数字变量和分类变量结合起来作为LSTM的输入?
输入向量应如何?
我阅读了有关嵌入的内容,但由于我想学习所有这些背后的逻辑,因此对我来说解释还不够。
像这样
model = Sequential()
model.add(LSTM(64, batch_input_shape=(batch_size, look_back, 1), stateful=True, return_sequences=True))
model.add(Dropout(0.3))
model.add(LSTM(32, batch_input_shape=(batch_size, look_back, 1), stateful=True)) …
Run Code Online (Sandbox Code Playgroud) 例如;
pd.Series('ASKING CD.').str.contains('AS')
Out[58]:
0 True
dtype: bool
pd.Series('ASKING CD.').str.contains('ASG')
Out[59]:
0 False
dtype: bool
pd.Series('ASKING CD.').str.contains('SK.')
Out[60]:
0 True
dtype: bool
Run Code Online (Sandbox Code Playgroud)
为什么第三个输出是真的?没有'SK'.传递字符串中的序列.'dot'字符没有任何意义?