我有一个csv文件有25列,有些是数字的,有些是绝对的,有些像演员,导演的名字.我想在这些数据上使用回归模型.为此,我必须使用scikit包中的LabelBinarizer将分类列字符串类型转换为数值.如何在具有多个分类数据的数据框上使用LabelBinarize?
基本上我想要将标签二值化并将它们添加到数据帧中.
在下面的代码中,我检索了我想要binarize的列的列表,但是无法弄清楚如何将新列添加回df?
categorylist = ['color', 'language', 'country', 'content_rating']
for col in categorylist:
tempdf = label_binarizer.fit_transform(df[col])
Run Code Online (Sandbox Code Playgroud)
在接下来的步骤,我想加入tempdf到df并删除原始列DF [COL].
我正在使用Kitchen在我的本地机器上测试一本烹饪书.我得到以下错误.
Recipe Compile Error in /tmp/kitchen/cache/cookbooks/windows/libraries/windows_package.rb
I, [2018-04-18T15:52:46.333373 #55288] INFO -- default-ubuntu-1404: ================================================================================
I, [2018-04-18T15:52:46.333444 #55288] INFO -- default-ubuntu-1404:
I, [2018-04-18T15:52:46.333714 #55288] INFO -- default-ubuntu-1404: LoadError
I, [2018-04-18T15:52:46.333755 #55288] INFO -- default-ubuntu-1404: ---------
I, [2018-04-18T15:52:46.333933 #55288] INFO -- default-ubuntu-1404: cannot load such file -- chef/mixin/language
I, [2018-04-18T15:52:46.333976 #55288] INFO -- default-ubuntu-1404:
I, [2018-04-18T15:52:46.334003 #55288] INFO -- default-ubuntu-1404: Cookbook Trace:
I, [2018-04-18T15:52:46.334036 #55288] INFO -- default-ubuntu-1404: ---------------
I, [2018-04-18T15:52:46.334059 #55288] INFO -- default-ubuntu-1404: /tmp/kitchen/cache/cookbooks/windows/libraries/windows_package.rb:7:in `<top (required)>'
I, [2018-04-18T15:52:46.334082 #55288] INFO -- …Run Code Online (Sandbox Code Playgroud)