我有一个箱线图,需要删除 x 轴('user_type' 和 'member_gender')标签。鉴于以下格式,我该怎么做?
sb.boxplot(x="user_type", y="Seconds", data=df, color = default_color, ax = ax[0,0], sym='').set_title('User-Type (0=Non-Subscriber, 1=Subscriber)')
sb.boxplot(x="member_gender", y="Seconds", data=df, color = default_color, ax = ax[1,0], sym='').set_title('Gender (0=Male, 1=Female, 2=Other)')
Run Code Online (Sandbox Code Playgroud) 这是我的桌子:
A B C E
0 1 1 5 4
1 1 1 1 1
2 3 3 8 2
Run Code Online (Sandbox Code Playgroud)
现在,我想按A列和B列对所有行进行分组。应该对C列求和,对于E列,我想使用C值为最大值的值。
我完成了将A和B分组并求和C的第一部分。
df = df.groupby(['A', 'B'])['C'].sum()
Run Code Online (Sandbox Code Playgroud)
但是在这一点上,我不确定如何告诉E列应采用C为最大值的值。
最终结果应如下所示:
A B C E
0 1 1 6 4
1 3 3 8 2
Run Code Online (Sandbox Code Playgroud)
有人可以帮我解决过去的问题吗?谢谢!
我正在绘制树形图,想知道如何绘制树类的相对百分比,即
A 组 =100
组 B =30
组 C =50
组 D =20
然后,在图中,它应该
在其“X 组”标签旁边添加:“
50%”用于 A 组,“
15%”用于 B 组
等。鉴于此代码,我将如何做到这一点?
!pip install squarify
import squarify
df = pd.DataFrame({'customers':[8,3,4,2], 'cluster':["group A", "group B", "group C", "group D"] })
squarify.plot(sizes=df['customers'], label=df['cluster'], alpha=.8 )
plt.axis('off')
plt.show();
Run Code Online (Sandbox Code Playgroud)
我已经搜索过但没有找到我需要的东西。我有一个有 50 列的数据框。第一个是日期数据类型,其余的是浮点数数据类型。
现在我只想将浮点列转换为整数,而不是日期列。有人可以指导吗?
当我像这样对 df 进行切片df_sub1=df_sub.iloc[:, 1:].apply(np.int64),然后与后面的日期列连接时,它会使我的笔记本电脑崩溃,因此无法工作。我希望有更好的方法。
我正在尝试使用 Databricks 中的 Plotly 库渲染图表。但是,没有渲染任何图像。我用这个语句为例:
from plotly.offline import init_notebook_mode, iplot
from plotly import graph_objs as go
# Initialize plotly
init_notebook_mode(connected=True)
daily_df=df
def plotly_df(df, title=''):
"""Visualize all the dataframe columns as line plots."""
common_kw = dict(x=df.index, mode='lines')
data = [go.Scatter(y=df[c], name=c, **common_kw) for c in df.columns]
layout = dict(title=title)
fig = dict(data=data, layout=layout)
iplot(fig, show_link=False)
plotly_df(daily_df)
Run Code Online (Sandbox Code Playgroud)
没有输出。为什么?
我能够使用Seaborn在箱图中可视化我的数据。
sns.boxplot( x=df['Score'].astype('float'), y=df['Group'] )
Run Code Online (Sandbox Code Playgroud)
可视化显示了我:所有四个四分位数,上下晶须以及一些离群值。如何将中线添加到箱线图中?请参阅当前的可视化效果(无平均值)。
谢谢!
我正在尝试将带有标题的文本框从幻灯片的中心移动到顶部。我无法找到适合我的脚本的正确参数。以下是一些与之相关的行:
#setting slide type "Title and Content"
title_only_layout = pptx.slide_layouts[1]
#Adding content into the title box
pptx.slides.add_slide(title_only_layout)
pptx.slides[idx].shapes.title.text = "I am a title!"
Run Code Online (Sandbox Code Playgroud)
这些命令将标题框添加到卡片组的中央。我该如何调整这个脚本?
我试图在 SQL 语句中使用 Date_Trunc for MONTH 函数,但不知何故它对我不起作用。我正在尝试提取 2019 年 4 月 1 日之后发生的条目。Redshift 数据库中的原始日期格式是我尝试将其分组为月/年存储桶的格式:2019-04-08T00:13:20.000Z
输入
SELECT
client_id as user_id,
session_utc as job_date --(format:2019-04-08T00:13:20.000Z)
FROM table1 as hits
WHERE job_date >= DATE_TRUNC('month', 2019-04-01)
group by 1,2;
Run Code Online (Sandbox Code Playgroud)
输出
"ERROR: function date_trunc("unknown", integer) does not exist Hint: No function matches the given name and argument types. You may need to add explicit type casts."
Run Code Online (Sandbox Code Playgroud)
我究竟做错了什么?
python-3.x ×6
python ×4
matplotlib ×2
pandas ×2
seaborn ×2
boxplot ×1
databricks ×1
plotly ×1
python-pptx ×1
sql ×1
squarify ×1