小编Ric*_* Ji的帖子

想知道pd.factorize,pd.get_dummies,sklearn.preprocessing.LableEncoder和OneHotEncoder之间的差异

所有四个功能看起来都和我很相似.在某些情况下,其中一些可能会给出相同的结果,有些则不会.任何帮助将不胜感激!

现在我知道并且我在内部假设,factorizeLabelEncoder以相同的方式工作,并且在结果方面没有太大的差异.我不确定他们是否会在大量数据上占用相似的时间.

get_dummiesOneHotEncoder会产生相同的结果,但OneHotEncoder只能处理数字,但get_dummies会采取各种输入.get_dummies将为每个列输入自动生成新的列名,但OneHotEncoder不会(它将分配新的列名1,2,3 ....).因此get_dummies在各个方面都更好.

如果我错了请纠正我!谢谢!

python encoding machine-learning pandas scikit-learn

18
推荐指数
1
解决办法
5471
查看次数