基于DataFrame列名称的颜色seaborn boxplot

Fre*_*eek 8 python matplotlib python-3.x pandas seaborn

我想创建一个箱形图列表,其框的颜色取决于我用作输入的pandas.DataFrame列的名称.

列名称包含指示实验条件的字符串,我希望盒子图的颜色框基于该实验条件.

我这样做是为了制作箱形图:

sns.boxplot(data = data.dropna(), orient="h")
plt.show()
Run Code Online (Sandbox Code Playgroud)

这将创建一个包含正确名称的漂亮的箱图列表.现在我想给每个名为红色的'prog +,DMSO +'的箱形图,其余为蓝色.

我尝试创建一个字典,列名作为键,颜色作为值:

color = {}
for column in data.columns:
    if 'prog+, DMSO+' in column:
        color[column] = 'red'
    else:
        color[column] = 'blue'
Run Code Online (Sandbox Code Playgroud)

然后使用字典作为颜色:

sns.boxplot(data = data.dropna(), orient="h", color=color[column])
plt.show()
Run Code Online (Sandbox Code Playgroud)

这不起作用,可以理解(没有循环通过字典).所以我做了一个循环:

for column in data.columns:
    sns.boxplot(data = data[column], orient='h', color=color[column])
plt.show()
Run Code Online (Sandbox Code Playgroud)

这确实制作了不同颜色的箱形图,但它们彼此重叠并且没有正确的标签.如果我能以某种方式将这些箱形图很好地放在彼此之下的一个图中,那么我几乎就是我想要的.或者,还有更好的方法?

mwa*_*kom 10

您应该使用palette处理多种颜色的参数,而不是color处理特定颜色的参数.您可以提供palette名称,有序列表或字典.后者似乎最适合您的问题:

import seaborn as sns
sns.set_color_codes()
tips = sns.load_dataset("tips")
pal = {day: "r" if day == "Sat" else "b" for day in tips.day.unique()}
sns.boxplot(x="day", y="total_bill", data=tips, palette=pal)
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述


tmd*_*son 8

使用后,您可以在将它们全部一次性绘制后设置各个框的面部颜色 ax.artists[i].set_facecolor('r')

例如:

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd

df = pd.DataFrame(
        [[2, 4, 5, 6, 1],
         [4, 5, 6, 7, 2],
         [5, 4, 5, 5, 1],
         [10, 4, 7, 8, 2],
         [9, 3, 4, 6, 2],
         [3, 3, 4, 4, 1]
        ],columns=['bar', 'prog +, DMSO+ 1', 'foo', 'something', 'prog +, DMSO+ 2'])

ax = sns.boxplot(data=df,orient='h')

boxes = ax.artists

for i,box in enumerate(boxes):
    if 'prog +, DMSO+' in df.columns[i]:
        box.set_facecolor('r')
    else:
        box.set_facecolor('b')

plt.tight_layout()
plt.show()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述