标签: histplot

如何使用seaborn distplot / histplot / displot绘制百分比

有没有办法在 distplot 上绘制百分比而不是计数?

ax = sns.FacetGrid(telcom, hue='Churn', palette=["teal", "crimson"], size=5, aspect=1)
ax = ax.map(sns.distplot, "tenure",  hist=True, kde=False)
ax.fig.suptitle('Tenure distribution in customer churn', y=1, fontsize=16, fontweight='bold');
plt.legend();
Run Code Online (Sandbox Code Playgroud)

代码生成的图像

python pandas seaborn displot histplot

7
推荐指数
2
解决办法
2万
查看次数

如何修改 sns.histplot 中的核密度估计线

我正在创建一个直方图(频率与计数),并且我想添加不同颜色的核密度估计线。我怎样才能做到这一点?例如我想改变颜色

sns.histplot(data=penguins, x="flipper_length_mm", kde=True)

在此输入图像描述

示例取自https://seaborn.pydata.org/ generated/seaborn.histplot.html

python seaborn displot kdeplot histplot

6
推荐指数
1
解决办法
8547
查看次数

在直方图上叠加箱线图或均值与误差线

我正在 Seaborn 中以非常标准的方式创建数据的直方图,即:

rc = {'font.size': 32, 'axes.labelsize': 28.5, 'legend.fontsize': 32.0, 
    'axes.titlesize': 32, 'xtick.labelsize': 31, 'ytick.labelsize': 12}
sns.set(style="ticks", color_codes=True, rc = rc)
plt.figure(figsize=(25,20),dpi=300)

ax = sns.distplot(synData['SYNERGY_SCORE'])
print (np.mean(synData['SYNERGY_SCORE']), np.std(synData['SYNERGY_SCORE']))
# ax = sns.boxplot(synData['SYNERGY_SCORE'], orient = 'h') 

ax.set(xlabel = 'Synergy Score', ylabel = 'Frequency', title = 'Aggregate Synergy Score Distribution')
Run Code Online (Sandbox Code Playgroud)

这会产生以下输出:标准直方图。

我还想在同一个图上可视化该数据集的平均值 + 标准差,理想情况下通过在 x 轴(或 x 轴正上方)上有一个平均值点和显示标准差的缺口误差条来实现。另一种选择是围绕 x 轴的箱线图。我尝试只添加注释掉的行(sns.boxplot()),但它看起来非常丑陋,根本不是我想要的。有什么建议么?

python matplotlib boxplot seaborn histplot

4
推荐指数
1
解决办法
4324
查看次数

如何更改seaborn的pairplot()函数中的bin数?

我有一个 36000 行和 51 列的数据集。每行都是一个观察值,前 50 列是每个观察值的 50 个不同特征。第 51 列的值为 0 或 1,其中 0 表示观测值属于 A 类,1 表示观测值属于 B 类。

现在假设我想制作第一列的值的直方图,将其称为“Feature1”。据我所知,matplotlib的plt.hist()无法在同一个图中绘制2个直方图,其中一个对应于A类中Feature1的特征,另一个对应于B类中的特征。另外,seaborn 的 sns.distplot 也不能​​做到这一点。所以我决定尝试seaborn的pairplot如下

sns.pairplot(df, vars = ["Feature1"], hue= "Class", diag_kind = "hist", diag_kws= dict(alpha=0.55))
Run Code Online (Sandbox Code Playgroud)

Feature1 是第一列的名称,Class 是最后一列的名称,其中包含每个观测值的类标签。显示的直方图很好,但我想增加使用的垃圾箱数量。遗憾的是我没有找到任何方法来使用这个特定的函数来做到这一点。

有人知道这个问题的解决方案吗?谢谢

python seaborn pairplot histplot

3
推荐指数
1
解决办法
5775
查看次数

标签 统计

histplot ×4

python ×4

seaborn ×4

displot ×2

boxplot ×1

kdeplot ×1

matplotlib ×1

pairplot ×1

pandas ×1