有没有办法在 distplot 上绘制百分比而不是计数?
ax = sns.FacetGrid(telcom, hue='Churn', palette=["teal", "crimson"], size=5, aspect=1)
ax = ax.map(sns.distplot, "tenure", hist=True, kde=False)
ax.fig.suptitle('Tenure distribution in customer churn', y=1, fontsize=16, fontweight='bold');
plt.legend();
Run Code Online (Sandbox Code Playgroud)
我正在创建一个直方图(频率与计数),并且我想添加不同颜色的核密度估计线。我怎样才能做到这一点?例如我想改变颜色
sns.histplot(data=penguins, x="flipper_length_mm", kde=True)
示例取自https://seaborn.pydata.org/ generated/seaborn.histplot.html
我正在 Seaborn 中以非常标准的方式创建数据的直方图,即:
rc = {'font.size': 32, 'axes.labelsize': 28.5, 'legend.fontsize': 32.0,
'axes.titlesize': 32, 'xtick.labelsize': 31, 'ytick.labelsize': 12}
sns.set(style="ticks", color_codes=True, rc = rc)
plt.figure(figsize=(25,20),dpi=300)
ax = sns.distplot(synData['SYNERGY_SCORE'])
print (np.mean(synData['SYNERGY_SCORE']), np.std(synData['SYNERGY_SCORE']))
# ax = sns.boxplot(synData['SYNERGY_SCORE'], orient = 'h')
ax.set(xlabel = 'Synergy Score', ylabel = 'Frequency', title = 'Aggregate Synergy Score Distribution')
Run Code Online (Sandbox Code Playgroud)
这会产生以下输出:
我还想在同一个图上可视化该数据集的平均值 + 标准差,理想情况下通过在 x 轴(或 x 轴正上方)上有一个平均值点和显示标准差的缺口误差条来实现。另一种选择是围绕 x 轴的箱线图。我尝试只添加注释掉的行(sns.boxplot()),但它看起来非常丑陋,根本不是我想要的。有什么建议么?
我有一个 36000 行和 51 列的数据集。每行都是一个观察值,前 50 列是每个观察值的 50 个不同特征。第 51 列的值为 0 或 1,其中 0 表示观测值属于 A 类,1 表示观测值属于 B 类。
现在假设我想制作第一列的值的直方图,将其称为“Feature1”。据我所知,matplotlib的plt.hist()无法在同一个图中绘制2个直方图,其中一个对应于A类中Feature1的特征,另一个对应于B类中的特征。另外,seaborn 的 sns.distplot 也不能做到这一点。所以我决定尝试seaborn的pairplot如下
sns.pairplot(df, vars = ["Feature1"], hue= "Class", diag_kind = "hist", diag_kws= dict(alpha=0.55))
Run Code Online (Sandbox Code Playgroud)
Feature1 是第一列的名称,Class 是最后一列的名称,其中包含每个观测值的类标签。显示的直方图很好,但我想增加使用的垃圾箱数量。遗憾的是我没有找到任何方法来使用这个特定的函数来做到这一点。
有人知道这个问题的解决方案吗?谢谢