小编Cha*_* Li的帖子

在 python 中训练随机森林时,哪种 dtype 表现更好?

我试图randomforest用 python 训练一个分类器。然而,在我的原始版本中pandas.dataframe,有float64、object、datetime64、int64 和 bool dtypes(几乎是 pandas 中允许的所有类型的数据类型)。

  • 是否有必要将bool转换为floatint
  • 对于二值对象列,我应该将其转换为boolintfloat吗?哪一个会表现得更好?还是没关系?

谢谢!

python pandas scikit-learn

4
推荐指数
1
解决办法
2081
查看次数

如何计算Python中所有列的异常值?

我在Python笔记本中有三列数据集.似乎有超过1.5倍IQR的异常值.我想我怎么能算出所有列的异常值?

如果异常值太多,我可能会考虑删除多个特征作为异常值的点.如果是这样,我怎么能以这种方式计算呢?

谢谢!

在此输入图像描述

python pandas

2
推荐指数
1
解决办法
5508
查看次数

标签 统计

pandas ×2

python ×2

scikit-learn ×1