Aar*_*ron 6 python matplotlib boxplot seaborn
有没有办法在绘制 Seaborn Boxplot 后提取所有异常值?例如,如果我正在为以下数据绘制箱线图
client total
1 LA 1
2 Sultan 128
3 ElderCare 1
4 CA 3
5 More 900
Run Code Online (Sandbox Code Playgroud)
我想在绘制箱线图后看到以下记录作为异常值返回。
2 Sultan 128
5 More 900
Run Code Online (Sandbox Code Playgroud)
Y. *_*Luo 12
Seaborn 使用 matplotlib 处理异常值计算,这意味着关键参数whis
被传递到ax.boxplot
。此处记录了负责计算的特定函数:https : //matplotlib.org/api/cbook_api.html#matplotlib.cbook.boxplot_stats。您可以使用matplotlib.cbook.boxplot_stats
计算而不是提取异常值。以下代码片段向您展示了计算以及它与 seaborn 图的相同之处:
import matplotlib.pyplot as plt
from matplotlib.cbook import boxplot_stats
import pandas as pd
import seaborn as sns
data = [
('LA', 1),
('Sultan', 128),
('ElderCare', 1),
('CA', 3),
('More', 900),
]
df = pd.DataFrame(data, columns=('client', 'total'))
ax = sns.boxplot(data=df)
outliers = [y for stat in boxplot_stats(df['total']) for y in stat['fliers']]
print(outliers)
for y in outliers:
ax.plot(1, y, 'p')
ax.set_xlim(right=1.5)
plt.show()
Run Code Online (Sandbox Code Playgroud)
小智 5
下面的代码将为您提供一组异常值,使用它从数据框中提取值。
from matplotlib.cbook import boxplot_stats
boxplot_stats(df.colname).pop(0)['fliers']
Run Code Online (Sandbox Code Playgroud)