小编LaL*_*aTi的帖子

如何从 seaborn / matplotlib 图中删除或隐藏 x 轴标签

我有一个箱线图,需要删除 x 轴('user_type' 和 'member_gender')标签。鉴于以下格式,我该怎么做?

sb.boxplot(x="user_type", y="Seconds", data=df, color = default_color, ax = ax[0,0], sym='').set_title('User-Type (0=Non-Subscriber, 1=Subscriber)')
sb.boxplot(x="member_gender", y="Seconds", data=df, color = default_color, ax = ax[1,0], sym='').set_title('Gender (0=Male, 1=Female, 2=Other)')
Run Code Online (Sandbox Code Playgroud)

python matplotlib python-3.x pandas seaborn

12
推荐指数
1
解决办法
3万
查看次数

df.groupby()修改需要帮助

这是我的桌子:

   A  B  C  E
0  1  1  5  4
1  1  1  1  1
2  3  3  8  2
Run Code Online (Sandbox Code Playgroud)

现在,我想按A列和B列对所有行进行分组。应该对C列求和,对于E列,我想使用C值为最大值的值。

我完成了将A和B分组并求和C的第一部分。

df = df.groupby(['A', 'B'])['C'].sum()
Run Code Online (Sandbox Code Playgroud)

但是在这一点上,我不确定如何告诉E列应采用C为最大值的值。

最终结果应如下所示:

   A  B  C  E
0  1  1  6  4
1  3  3  8  2
Run Code Online (Sandbox Code Playgroud)

有人可以帮我解决过去的问题吗?谢谢!

python python-3.x pandas

5
推荐指数
0
解决办法
84
查看次数

如何在树状图上添加 % 信息?

我正在绘制树形图,想知道如何绘制树类的相对百分比,即

A 组 =100
组 B =30
组 C =50
组 D =20

然后,在图中,它应该 在其“X 组”标签旁边添加:“
50%”用于 A 组,“
15%”用于 B 组
等。鉴于此代码,我将如何做到这一点?

!pip install squarify
import squarify 
df = pd.DataFrame({'customers':[8,3,4,2], 'cluster':["group A", "group B", "group C", "group D"] })
squarify.plot(sizes=df['customers'], label=df['cluster'], alpha=.8 )
plt.axis('off')
plt.show();
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

python python-3.x squarify

5
推荐指数
1
解决办法
1688
查看次数

如何转换数据框中除第一列之外的所有浮点列?

我已经搜索过但没有找到我需要的东西。我有一个有 50 列的数据框。第一个是日期数据类型,其余的是浮点数数据类型。

现在我只想将浮点列转换为整数,而不是日期列。有人可以指导吗?

当我像这样对 df 进行切片df_sub1=df_sub.iloc[:, 1:].apply(np.int64),然后与后面的日期列连接时,它会使我的笔记本电脑崩溃,因此无法工作。我希望有更好的方法。

python-3.x

4
推荐指数
1
解决办法
5855
查看次数

如何使用 Plotly 在 Databricks 中渲染图表?

我正在尝试使用 Databricks 中的 Plotly 库渲染图表。但是,没有渲染任何图像。我用这个语句为例:

from plotly.offline import init_notebook_mode, iplot
from plotly import graph_objs as go

    # Initialize plotly
    init_notebook_mode(connected=True)

    daily_df=df

    def plotly_df(df, title=''):
        """Visualize all the dataframe columns as line plots."""
        common_kw = dict(x=df.index, mode='lines')
        data = [go.Scatter(y=df[c], name=c, **common_kw) for c in df.columns]
        layout = dict(title=title)
        fig = dict(data=data, layout=layout)
        iplot(fig, show_link=False)

    plotly_df(daily_df)
Run Code Online (Sandbox Code Playgroud)

没有输出。为什么?

matplotlib python-3.x plotly databricks

4
推荐指数
1
解决办法
7041
查看次数

Python Seaborn:如何在箱线图可视化中添加均值?

我能够使用Seaborn在箱图中可视化我的数据。

sns.boxplot( x=df['Score'].astype('float'), y=df['Group'] )
Run Code Online (Sandbox Code Playgroud)

可视化显示了我:所有四个四分位数,上下晶须以及一些离群值。如何将中线添加到箱线图中?请参阅当前的可视化效果(无平均值)。

在此处输入图片说明

谢谢!

boxplot python-3.x seaborn

3
推荐指数
1
解决办法
3160
查看次数

如何使用 pptx-python 库更改标题位置?

我正在尝试将带有标题的文本框从幻灯片的中心移动到顶部。我无法找到适合我的脚本的正确参数。以下是一些与之相关的行:

#setting slide type "Title and Content"
title_only_layout = pptx.slide_layouts[1]

#Adding content into the title box
pptx.slides.add_slide(title_only_layout)
pptx.slides[idx].shapes.title.text = "I am a title!"
Run Code Online (Sandbox Code Playgroud)

这些命令将标题框添加到卡片组的中央。我该如何调整这个脚本?

python python-pptx

3
推荐指数
1
解决办法
4211
查看次数

Date_Trunc 无法按预期工作

我试图在 SQL 语句中使用 Date_Trunc for MONTH 函数,但不知何故它对我不起作用。我正在尝试提取 2019 年 4 月 1 日之后发生的条目。Redshift 数据库中的原始日期格式是我尝试将其分组为月/年存储桶的格式:2019-04-08T00:13:20.000Z

输入

SELECT
    client_id as user_id,
    session_utc as job_date --(format:2019-04-08T00:13:20.000Z)
    FROM  table1 as hits
    WHERE job_date >= DATE_TRUNC('month', 2019-04-01) 
    group by 1,2;
Run Code Online (Sandbox Code Playgroud)

输出

"ERROR: function date_trunc("unknown", integer) does not exist Hint: No function matches the given name and argument types. You may need to add explicit type casts."
Run Code Online (Sandbox Code Playgroud)

我究竟做错了什么?

sql amazon-web-services amazon-redshift

2
推荐指数
1
解决办法
2万
查看次数