DMatrix有什么用?

Sne*_*gsu 15 python machine-learning xgboost

文档说:

XGBoost 中使用的数据矩阵。DMatrix 是 XGBoost 使用的内部数据结构,它针对内存效率和训练速度进行了优化。您可以从多个不同的数据源构建 DMatrix。

我明白了这一点,但是 DMatrix 与 Pandas Dataframe 有什么区别/用途?

小智 18

使用XGBoost Python 包时,您可以选择两个不同的 API 来训练您的模型。XGB 自己的Learning APIScikit-Learn API
使用 Scikit-Learn API 时,数据作为 numpy 数组或 pandas 数据帧传递到模型。使用学习 API 时,数据是使用 DMatrix 传递的。

查看python 示例,了解所使用的两个 API。

基本上,您已经在文档中找到了“使用 DMatrix 而不是 Pandas Dataframe”:它是 XGBoost 开发人员通过其机器学习库为“内存效率和训练速度”创建的数据结构。

  • 有没有办法打印 DMatrix? (2认同)