Shi*_*dra 4 python normalization pandas scikit-learn
所以我有一个数据框,我通过合并训练(标记)和测试(未标记)数据帧形成.并且为了取消附加测试数据框,我保留了一个列,如果该行属于训练或测试,则该列具有标识符.现在我必须规范化所有列中的所有值,除了这一列"Sl No." 但我没有找到任何方法通过这一栏.这就是我在做的事情
import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler
data_norm = data_x_filled.copy() #Has training + test data frames combined to form single data frame
normalizer = StandardScaler()
data_array = normalizer.fit_transform(data_norm)
data_norm = pd.DataFrame(data_array,columns = data_norm.columns).set_index(data_norm.index)
Run Code Online (Sandbox Code Playgroud)
我只想排除"Sl No."栏目 规范化但希望在规范化后保留它.
尝试这可能工作numpy用作np:
data_norm = data_x_filled.copy() #Has training + test data frames combined to form single data frame
normalizer = StandardScaler()
data_array = normalizer.fit_transform(data_norm.ix[:,data_norm.columns!='SI No'])
data_norm = pd.DataFrame(np.column_stack((data_norm['SI No'].values,data_array)),columns = data_norm.columns).set_index(data_norm.index)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2193 次 |
| 最近记录: |