我正在尝试使用来自UCI存储库的汽车评估数据集,我想知道是否有一种方便的方法来对sklearn中的分类变量进行二值化.一种方法是使用LabelBinarizer的DictVectorizer,但在这里我得到了不同的特征,而你应该只有k-1以避免线性化.我想我可以编写自己的函数并删除一列,但是这个簿记很繁琐,是否有一种简单的方法来执行这样的转换并得到一个稀疏矩阵?
python machine-learning scikit-learn
machine-learning ×1
python ×1
scikit-learn ×1