scikit-learn 中的哪些估计器不支持稀疏矩阵?

Jac*_*ain 3 scikit-learn

我想训练一个具有很多名义属性的数据集。我从一些帖子中注意到,要转换名义属性必须将它们转换为重复的二进制特征。此外,据我所知,这样做会在概念上使数据集变得稀疏。我也知道 scikit-learn 使用带有一些估计器的稀疏矩阵,因为它更快。但我也发现一些估计器仍然不接受稀疏矩阵。我的问题是:到目前为止,哪些不接受稀疏矩阵?

Fre*_*Foo 5

您可以通过检查文档字符串来检查 scikit-learn 中的方法是否支持稀疏矩阵。如果它说

X : {array-like, sparse matrix}
Run Code Online (Sandbox Code Playgroud)

然后支持稀疏矩阵输入。当它说只是“类似数组”时,它们不受支持。