Chr*_*ris 2 python matplotlib histogram seaborn
我有一个关于直方图的 y 轴的问题,这些直方图是在带有 seaborn 的默认配对图中生成的。
下面是一些示例代码:
import pandas as pd
import seaborn as sns
import numpy as np
data = [np.random.random_sample(20), np.random.random_sample(20)]
dataFrame = pd.DataFrame(data=zip(*data))
g = sns.pairplot(dataFrame)
g.savefig("test.png", dpi=100)
Run Code Online (Sandbox Code Playgroud)
对角线放置的直方图中 y 轴的单位是什么?如何在此视图中读取垃圾箱的高度?
非常感谢,
克里斯
默认情况下,pairplot使用对角线“显示该列中变量数据的单变量分布”(http://stanford.edu/~mwaskom/software/seaborn/generated/seaborn.pairplot.html)。
因此,每个条形表示相应 bin 中的值计数(您可以从 X 轴获得)。然而,Y 轴并不对应于实际计数,而是对应于散点图。
我无法从PairPlot自身获取数据,但如果您不另说,seaborn 用于plt.hist()生成该对角线,因此您可以使用以下方法获取数据:
import matplotlib.pyplot as plt
%matplotlib inline
import pandas as pd
import seaborn as sns
import numpy as np
data = [np.random.random_sample(20), np.random.random_sample(20)]
dataFrame = pd.DataFrame(data=zip(*data))
g = sns.pairplot(dataFrame)
Run Code Online (Sandbox Code Playgroud)
# for the first variable:
c, b, p = plt.hist(dataFrame.iloc[:,0])
print c
# [ 3. 6. 0. 2. 3. 0. 1. 3. 1. 1.]
Run Code Online (Sandbox Code Playgroud)