相关疑难解决方法(0)

我正在尝试使用scikit-learn在数据集上运行一些机器学习算法.我的数据集有一些类似于类别的功能.就像一个特征是A,其值1,2,3指定了某些东西的质量.1:Upper, 2: Second, 3: Third class.所以它就像一个序数变量.

同样地,我已经重新编码的变量城市,有三个值('London', Zurich', 'New York'成1,2,3,但与价值没有具体的偏好.所以现在这是一个名义上的分类变量.

如何在pandas中指定算法将其视为分类和序数等？与R一样,分类变量由因子(a)指定,因此不被视为连续值.在pandas/python中有类似的东西吗？

解决这个问题的最佳方法是什么？

谢谢

10
推荐指数

2
解决办法

1万
查看次数