我正在使用seaborn
的箱线图,但似乎无法弄清楚默认设置中胡须的位置。
查看seaborn.boxplot
文档,我看到whis=1.5
我认为这意味着胡须位于UPPER_QUARTILE + IQR*1.5
和LOWER_QUARTILE - IQR*1.5
。
但即使在文档本身中,查看胡须,我们也可以看到它们与上/下四分位数的间隙长度不同
很容易看出盒子两边到胡须的长度是不相等的,所以我的假设显然是错误的。
那么默认的胡须是如何放置的呢?或者我可能无法理解关于箱线图本质的一些更基本的东西?
IIRC,晶须延伸到最低(最高)数据点,仍然在下(上)四分位数的 1.5 IQR 范围内。因此,根据数据点的实际位置,两侧的胡须不一定具有相同的长度。
Matplotlib文档(Seaborn 建立在其之上)的whis
论点boxplot()
似乎证实了这一点:
whis :浮点数、序列或字符串(默认值 = 1.5)作为浮点数,确定胡须到达第一个和第三个四分位数之后的范围。换句话说,当 IQR 是四分位距 (Q3-Q1) 时,上须将延伸到小于 Q3 + whis*IQR 的最后一个数据。类似地,下部晶须将延伸到大于 Q1 的第一个数据 - whis*IQR。在须线之外,数据被视为异常值并绘制为单个点。
归档时间: |
|
查看次数: |
2058 次 |
最近记录: |