如何绘制seaborn中两个分布的差异?

har*_*on4 9 python matplotlib seaborn

我有以下代码来比较两个分布:

sns.kdeplot(df['term'][df['outcome'] == 0], shade=1, color='red')
sns.kdeplot(df['term'][df['outcome'] == 1], shade=1, color='green'); 
Run Code Online (Sandbox Code Playgroud)

它看起来像这样:

在此处输入图片说明

如何仅绘制两种分布的差异(disA - disB)?当然,它可能包含负值。

Imp*_*est 9

由于两条 kde 曲线之间的差异不是 kde 曲线本身,因此您不能kdeplot用来绘制该差异。

使用 可以轻松计算 kde scipy.stats.gaussian_kde。结果很容易用 pyplot 绘制。

import numpy as np; np.random.seed(0)
import matplotlib.pyplot as plt
import scipy.stats

a = np.random.gumbel(80, 25, 1000)
b = np.random.gumbel(90, 46, 4000)

kdea = scipy.stats.gaussian_kde(a)
kdeb = scipy.stats.gaussian_kde(b)

grid = np.linspace(0,500, 501)

plt.plot(grid, kdea(grid), label="kde A")
plt.plot(grid, kdeb(grid), label="kde B")
plt.plot(grid, kdea(grid)-kdeb(grid), label="difference")

plt.legend()
plt.show()
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

请注意,结果实际上只是曲线之间的差异(按照要求);它根本没有统计相关性。