具有缺失值的 SMOTE

MJe*_*emy 6 python scikit-learn imblearn

我正在尝试使用imblearnPython 中的包中的 SMOTE,但我的数据有很多缺失值,并且出现以下错误:

ValueError:输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值。

我查了一下这里的参数,好像没有处理缺失值的。

有没有办法生成带有缺失值的合成样本?

Moh*_*hif 5

SMOTE 不会执行填充缺失值或 NaN 值。您需要将它们填满,然后进行 SMOTE 分析。处理缺失值完全是一个不同的任务,你可以从 sklearn 的Imputer开始。这是关于 sklearn 关于缺失值的另一篇文章:Imputing Missing Values

处理完 NaN 值后,将修改后的数据输入到SMOTE.

参考