Sne*_*gsu 15 python machine-learning xgboost
文档说:
XGBoost 中使用的数据矩阵。DMatrix 是 XGBoost 使用的内部数据结构,它针对内存效率和训练速度进行了优化。您可以从多个不同的数据源构建 DMatrix。
我明白了这一点,但是 DMatrix 与 Pandas Dataframe 有什么区别/用途?
小智 18
使用XGBoost Python 包时,您可以选择两个不同的 API 来训练您的模型。XGB 自己的Learning API和Scikit-Learn API。
使用 Scikit-Learn API 时,数据作为 numpy 数组或 pandas 数据帧传递到模型。使用学习 API 时,数据是使用 DMatrix 传递的。
查看python 示例,了解所使用的两个 API。
基本上,您已经在文档中找到了“使用 DMatrix 而不是 Pandas Dataframe”:它是 XGBoost 开发人员通过其机器学习库为“内存效率和训练速度”创建的数据结构。
| 归档时间: |
|
| 查看次数: |
16816 次 |
| 最近记录: |