我正在尝试使用LabelEncoder然后使用OneHotEncoder将分类值(在我的情况下是“国家/地区”列)转换为编码后的值,并且能够转换分类值。但是我收到警告,就像不赞成使用OneHotEncoder'categorical_features'关键字“改为使用ColumnTransformer”。那么我如何使用ColumnTransformer来达到相同的结果呢?
以下是我的输入数据集和我尝试过的代码
Input Data set
Country Age Salary
France 44 72000
Spain 27 48000
Germany 30 54000
Spain 38 61000
Germany 40 67000
France 35 58000
Spain 26 52000
France 48 79000
Germany 50 83000
France 37 67000
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
#X is my dataset variable name
label_encoder = LabelEncoder()
x.iloc[:,0] = label_encoder.fit_transform(x.iloc[:,0]) #LabelEncoder is used to encode the country value
hot_encoder = OneHotEncoder(categorical_features = [0])
x = hot_encoder.fit_transform(x).toarray()
Run Code Online (Sandbox Code Playgroud)
和我得到的输出,如何使用列变压器获得相同的输出 …