LightGBM '在数据集中使用 categorical_feature。' 警告?

use*_*836 11 lightgbm

根据我对 LightGBM 文档的阅读,应该在 Dataset 方法中定义分类特征。所以我有以下代码:

cats=['C1', 'C2']
d_train = lgb.Dataset(X, label=y, categorical_feature=cats)
Run Code Online (Sandbox Code Playgroud)

但是,我收到以下错误消息:

/app/anaconda3/anaconda3/lib/python3.7/site-packages/lightgbm/basic.py:1243: UserWarning: 在数据集中使用 categorical_feature。warnings.warn('在数据集中使用categorical_feature。')

为什么我收到警告消息?

And*_*pov 18

我认为您在调用lgb.train. 这个函数也有参数categorical_feature,它的默认值是'auto',这意味着从pandas.DataFrame文档)中获取分类列。警告,这是在发出这条线,表明,尽管lgb.train已要求类别特征进行自动识别,LightGBM将使用数据集中指定替代的功能。

为了避免该警告,可以给同样的论点categorical_featurelgb.Datasetlgb.train。或者,您可以使用categorical_feature=None并且仅指定 中的分类特征来构建数据集lgb.train

  • 这还有效吗?无论我如何/在何处指定分类变量,我都会不断收到“覆盖参考数据集中的参数”。参数字典中的 categorical_column 被覆盖。 (4认同)