MJe*_*emy 6 python scikit-learn imblearn
我正在尝试使用imblearnPython 中的包中的 SMOTE,但我的数据有很多缺失值,并且出现以下错误:
ValueError:输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值。
我查了一下这里的参数,好像没有处理缺失值的。
有没有办法生成带有缺失值的合成样本?
SMOTE 不会执行填充缺失值或 NaN 值。您需要将它们填满,然后进行 SMOTE 分析。处理缺失值完全是一个不同的任务,你可以从 sklearn 的Imputer开始。这是关于 sklearn 关于缺失值的另一篇文章:Imputing Missing Values
处理完 NaN 值后,将修改后的数据输入到SMOTE.
参考