具有不同胡须长度的 Python 箱线图

Pak*_*wah 1 python matplotlib pandas

我在 Pandas 中使用该DataFrame.boxplot()函数,我相信它称为matplotlib.pyplot.boxplot(). 文档说这些箱线图的默认晶须长度应该是 1.5IQR,但我不明白为什么同一个盒子的上/下晶须在图中的长度不同。(具体配置我没有做过)

抱歉,我想发布该图像,但我没有足够的声誉,所以我将其放在免费图像托管网站上,链接:

http://postimg.org/image/z0xtfg9gd/

Pau*_*l H 5

听起来像是对箱线图的普遍误解。

一个箱线图与任何其他箱线图的胡须长度不同有两个原因

  1. 每个数据集的 IQR 都不同
  2. 晶须仅延伸 Q1 - 1.5 IQR 和 Q3 + 1.5 IQR 范围内的最外点。因此,如果 Q3 + 1.5*IQR = 75,但样本的最大值为 70,则须在 70 处绘制。

这个答案给出了如何构建箱线图(包括绘图)的完整解释。


Amy*_*den 5

您是否想问为什么顶部胡须与底部胡须的长度不同?我认为晶须实际上是 1.5 IQR 内的最低或最高数据点。因此,如果 Q3 和 Q3 + 1.5 IQR 之间没有数据点,则顶部晶须将不会显示。对于一个箱线图,其中顶部和底部的胡须都超出了胡须的异常值,胡须看起来确实大小相同。