小编vis*_*dav的帖子

One-hot 编码后的预测

我正在尝试使用示例数据帧：

data = [['Alex','USA',0],['Bob','India',1],['Clarke','SriLanka',0]]

df = pd.DataFrame(data,columns=['Name','Country','Traget'])

Run Code Online (Sandbox Code Playgroud)

现在，我使用 get_dummies 将字符串列转换为整数：

column_names=['Name','Country']  

one_hot = pd.get_dummies(df[column_names])

Run Code Online (Sandbox Code Playgroud)

转换后的列是： Age,Name_Alex,Name_Bob,Name_Clarke,Country_India,Country_SriLanka,Country_USA

切片数据。

x=df[["Name_Alex","Name_Bob","Name_Clarke","Country_India","Country_SriLanka","Country_USA"]].values  

y=df['Age'].values

Run Code Online (Sandbox Code Playgroud)

在训练和测试中拆分数据集

from sklearn.cross_validation import train_test_split

x_train,x_test,y_train,y_test=train_test_split(x,y,train_size=float(0.5),random_state=0)

Run Code Online (Sandbox Code Playgroud)

逻辑回归

from sklearn.linear_model import LogisticRegression

logreg = LogisticRegression()

logreg.fit(x_train, y_train)

Run Code Online (Sandbox Code Playgroud)

现在，模型被训练。

对于预测，假设我想通过给出“名称”和“国家”来预测“目标”。
像：[“亚历克斯”，“美国”]。

预言。

如果我使用这个：

logreg.predict([["Alex","USA"]).

Run Code Online (Sandbox Code Playgroud)

显然它不会工作。

问题 1）如何在训练期间应用 one-hot 编码后测试预测？

问题 2）如何对仅包含“名称”和“国家/地区”的示例 csv 文件进行预测？

python machine-learning pandas one-hot-encoding

vis*_*dav

2020 06-20

2
推荐指数

1
解决办法

3996
查看次数

为什么print("\ 5")在python中输出一个新行

print("\n")和之间有什么区别print("\5")？

我在下面的python shell中尝试过.

为什么print("\ 5")输出一个新行:

>>> print("\n")


>>> print("\5")

>>>

Run Code Online (Sandbox Code Playgroud)

但当我尝试时:

打印( "\ 4")

打印( "\ 6")

它正在打印一些二进制数据

python

vis*_*dav

2019 02-08

0
推荐指数

1
解决办法

75
查看次数

标签统计

python ×2

machine-learning ×1

one-hot-encoding ×1

pandas ×1

One-hot 编码后的预测

切片数据。

在训练和测试中拆分数据集

逻辑回归

预言。

问题 1）如何在训练期间应用 one-hot 编码后测试预测？

问题 2）如何对仅包含“名称”和“国家/地区”的示例 csv 文件进行预测？

为什么print("\ 5")在python中输出一个新行

标签 统计

小编vis_dav的帖子

标签统计