Plu*_*hil 8 indexing series dataframe pandas
/opt/conda/lib/python3.7/site-packages/ipykernel_launcher.py:8:FutureWarning:DataFrame 与 Series 比较的自动重新索引已弃用,并将在未来版本中引发 ValueError。left, right = left.align(right, axis=1, copy=False)之前做例如left == right
我尝试手动使用 z 分数从数据框中删除异常值
numerical_cols=df.select_dtypes(['int64','float64'])
for col in numerical_cols:
feature_value_less_than_3sigma=df[col].mean()-3*(df[col].std())
feature_value_greater_than_3sigma=df[col].mean()+3*(df[col].std())
df = df[~((df[col] < (feature_value_less_than_3sigma)) |(df[col] > (feature_value_greater_than_3sigma)))]
else:
print('\nAfter: ',df.shape)
Run Code Online (Sandbox Code Playgroud)
我不知道这个错误说明了什么,我想知道它,任何人都可以用一些简单的例子解释一下
代替:
df = df[~((df[col] < (feature_value_less_than_3sigma)) |(df[col] > (feature_value_greater_than_3sigma)))]
Run Code Online (Sandbox Code Playgroud)
使用:
df = df.query('~(%s < @feature_value_less_than_3sigma or %s > @feature_value_greater_than_3sigma)' %(col,col))
Run Code Online (Sandbox Code Playgroud)
这应该会消除错误。
| 归档时间: |
|
| 查看次数: |
4516 次 |
| 最近记录: |