sns.regplot 显示回归的阴影区域,这是没有意义的

pit*_*las 2 python pandas seaborn

鉴于:

f = pd.DataFrame({"a": [1,2,3], "b": [1,2,3]})
ax = sns.regplot(x="a", y="b", data=f)
Run Code Online (Sandbox Code Playgroud)

我得到的这张图表很令人困惑,因为这些点完全排列在一起。为什么会有阴影区域呢?我想我不明白阴影到底意味着什么。

在此输入图像描述

Stu*_*olf 6

它是回归估计的置信区间,您可以在 ci 选项下看到sns.regplot

ci int in [0, 100] 或 None,可选 回归估计置信区间的大小。这将使用回归线周围的半透明带绘制。使用 bootstrap 估计置信区间;对于大型数据集,建议将此参数设置为 None 来避免该计算。

在您的示例中,数据经过引导,并进行回归拟合,获得的预测超过 1000 倍,因此对于每个数据点,您可以获得 95% 的 ci。Bootstrap 具有替换功能,因此您可以得到 [1,1,2] 和 [1,1,2] 等,因此您会看到错误。一般来说,当样本数量较少时,误差可能会更大

您可以通过以下方式关闭此功能:

ax = sns.regplot(x="a", y="b", data=f,ci=None)
Run Code Online (Sandbox Code Playgroud)