我想训练一个具有很多名义属性的数据集。我从一些帖子中注意到,要转换名义属性必须将它们转换为重复的二进制特征。此外,据我所知,这样做会在概念上使数据集变得稀疏。我也知道 scikit-learn 使用带有一些估计器的稀疏矩阵,因为它更快。但我也发现一些估计器仍然不接受稀疏矩阵。我的问题是:到目前为止,哪些不接受稀疏矩阵?
您可以通过检查文档字符串来检查 scikit-learn 中的方法是否支持稀疏矩阵。如果它说
X : {array-like, sparse matrix}
Run Code Online (Sandbox Code Playgroud)
然后支持稀疏矩阵输入。当它说只是“类似数组”时,它们不受支持。
| 归档时间: |
|
| 查看次数: |
737 次 |
| 最近记录: |