所有四个功能看起来都和我很相似.在某些情况下,其中一些可能会给出相同的结果,有些则不会.任何帮助将不胜感激!
现在我知道并且我在内部假设,factorize并LabelEncoder以相同的方式工作,并且在结果方面没有太大的差异.我不确定他们是否会在大量数据上占用相似的时间.
get_dummies并OneHotEncoder会产生相同的结果,但OneHotEncoder只能处理数字,但get_dummies会采取各种输入.get_dummies将为每个列输入自动生成新的列名,但OneHotEncoder不会(它将分配新的列名1,2,3 ....).因此get_dummies在各个方面都更好.
如果我错了请纠正我!谢谢!