jea*_*elj 1 python pandas scikit-learn deprecation-warning
基于我之前的问题python pandas标准化回归列我将数据帧中的特定列重新调整为0到1之间.
scaler = preprocessing.MinMaxScaler(feature_range=(0,1))
email['scaled_quantity'] = scaler.fit_transform(email['Quantity'])
Run Code Online (Sandbox Code Playgroud)
不幸的是,我收到了这个错误
DeprecationWarning: Passing 1d arrays as data is deprecated in 0.17 and will raise ValueError in 0.19. Reshape your data either using X.reshape(-1, 1) if your data has a single feature or X.reshape(1, -1) if it contains a single sample.
warnings.warn(DEPRECATION_MSG_1D, DeprecationWarning)
Run Code Online (Sandbox Code Playgroud)
@Grr建议我将缩放应用于整个数据帧,但这不是一个选项.我需要按照它们的方式维护列,并且只想添加新的其他缩放列.
如何解决此折旧错误?
做什么
scaler.fit_transform(email[['Quantity']])
Run Code Online (Sandbox Code Playgroud)
代替
scaler.fit_transform(email['Quantity'])
Run Code Online (Sandbox Code Playgroud)
演示:我使用了上一个问题的示例数据集:
In [56]: scaler.fit_transform(df[['Event_Counts']])
Out[56]:
array([[ 0.99722347],
[ 1. ],
[ 0. ]])
Run Code Online (Sandbox Code Playgroud)
注意 - 它生成了一个形状(3,1)
而不是(3,)
作为新专栏:
In [58]: df['scaled_event_counts'] = scaler.fit_transform(df[['Event_Counts']])
In [59]: df
Out[59]:
Date Event_Counts Category_A Category_B scaled_event_counts
0 20170401 982457 0 1 0.997223
1 20170402 982754 1 0 1.000000
2 20170402 875786 0 1 0.000000
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
2921 次 |
最近记录: |