带有单独数据点的pyplot条形图

KDa*_*vis 1 python matplotlib

我有对照组和治疗组的数据。matplotlib是否能够创建条形图,其中条形高度是每个组的平均值与该组中的各个数据点重叠的值?我想可视化实际数据点的分布,类似于此处显示的内容。

我曾考虑过将箱线图和散点图结合使用,但我的尝试并未成功。

Ulr*_*ern 8

这里是使用 Seaborn 的解决方案,与直接使用 Matplotlib 相比,它提供了更短的代码,但放弃了一些灵活性:

import seaborn as sns, matplotlib.pyplot as plt
sns.set(style="whitegrid")

tips = sns.load_dataset("tips")

sns.barplot(x="day", y="total_bill", data=tips, capsize=.1, ci="sd")
sns.swarmplot(x="day", y="total_bill", data=tips, color="0", alpha=.35)

plt.show()
Run Code Online (Sandbox Code Playgroud)

结果如下: 带点的条形图


asc*_*ter 5

这是一种完全按照您所说的解决方案:将条形图与散点图重叠。

当然,您可以进一步调整图的位置:图标题,轴标签,颜色,宽度,散点图的标记形状...

import matplotlib.pyplot as plt
np.random.seed(123)

w = 0.8    # bar width
x = [1, 2] # x-coordinates of your bars
colors = [(0, 0, 1, 1), (1, 0, 0, 1)]    # corresponding colors
y = [np.random.random(30) * 2 + 5,       # data series
    np.random.random(10) * 3 + 8]

fig, ax = plt.subplots()
ax.bar(x,
       height=[np.mean(yi) for yi in y],
       yerr=[np.std(yi) for yi in y],    # error bars
       capsize=12, # error bar cap width in points
       width=w,    # bar width
       tick_label=["control", "test"],
       color=(0,0,0,0),  # face color transparent
       edgecolor=colors,
       #ecolor=colors,    # error bar colors; setting this raises an error for whatever reason.
       )

for i in range(len(x)):
    # distribute scatter randomly across whole width of bar
    ax.scatter(x[i] + np.random.random(y[i].size) * w - w / 2, y[i], color=colors[i])

plt.show()
Run Code Online (Sandbox Code Playgroud)

它将产生此图

散点图