小编Adi*_*ama的帖子

如何在使用sklearn进行one-hot编码后给出列名?

这是我的问题,我希望有人能帮我弄清楚..

解释一下,我的数据集中有 10 多个类别列,每个类别都有 200-300 个类别。我想将它们转换为二进制值。为此,我使用第一个标签编码器将字符串类别转换为数字。标签编码器代码和输出如下所示。

https://i.stack.imgur.com/MIVHV.png

在标签编码器之后,我再次使用了来自 scikit-learn 的 One Hot Encoder 并且它有效。但问题是,我需要一个热编码器后的列名。例如,在编码前具有分类值的 A 列。A = [1,2,3,4,..]

编码后应该是这样的

A-1、A-2、A-3

任何人都知道如何在一次热编码后将列名分配给(旧列名 - 值名称或编号)。这是我的一种热编码及其输出;

https://i.stack.imgur.com/kgrNa.png

我需要带名称的列,因为我训练了一个 ANN,但是每次出现数据时,我都无法一次又一次地转换所有过去的数据。所以,我想每次都添加新的。还是谢谢..

python encoding scikit-learn one-hot-encoding

14
推荐指数
2
解决办法
1万
查看次数

标签 统计

encoding ×1

one-hot-encoding ×1

python ×1

scikit-learn ×1