小编Vin*_*lva的帖子

为什么sklearn Imputer需要适合?

我是整个机器学习的新手,我正在上这个主题的在线课程.在本课程中,教师展示了以下代码:

imputer = Inputer(missing_values = 'Nan', strategy = 'mean', axis=0)
imputer = Imputer.fit(X[:, 1:3])
X[:, 1:3] = imputer.transform(X[:, 1:3])
Run Code Online (Sandbox Code Playgroud)

我真的不明白为什么这个imputer对象需要fit.我的意思是,我只是试图通过用列平均值替换它来消除我的列中的缺失值.从我对编程的了解很少,这是一个非常简单的迭代过程,并且不需要一个必须训练数据才能完成的模型.

有人可以解释一下这个不可思议的东西是如何工作的,以及为什么需要培训来用列平均值替换一些缺失值?我已经阅读过sci-kit的文档,但它只是展示了如何使用这些方法,而不是为什么需要它们.

谢谢.

machine-learning scikit-learn

22
推荐指数
1
解决办法
8107
查看次数

标签 统计

machine-learning ×1

scikit-learn ×1