我了解如何重命名列,但我想重命名数据框中的索引(行名称)。
我有一个包含 350 行的表格,然后我在底部添加了总数。然后我删除了除最后一行之外的每一行。
-------------------------------------------------
| | A | B | C |
-------------------------------------------------
| TOTAL | 1243 | 423 | 23 |
-------------------------------------------------
Run Code Online (Sandbox Code Playgroud)
所以我有名为“总计”的行,然后是几列。我想将“总计”一词重命名为其他名称。
这甚至可能吗?
非常感谢
我有一个由此代码生成的数据框:
hmdf = pd.DataFrame(hm01)
new_hm02 = hmdf[['FinancialYear','Month']]
new_hm01 = hmdf[['FinancialYear','Month','FirstReceivedDate']]
hm05 = new_hm01.pivot_table(index=['FinancialYear','Month'], aggfunc='count')
vals1 = ['April ', 'May ', 'June ', 'July ', 'August ', 'September', 'October ', 'November ', 'December ', 'January ', 'February ', 'March ']
df_hm = new_hm01.groupby(['Month', 'FinancialYear']).size().unstack(fill_value=0).rename(columns=lambda x: '{}'.format(x))
df_hml = df_hm.reindex(vals1)
Run Code Online (Sandbox Code Playgroud)
然后我有一个功能来突出显示每列中的最大值:
def highlight_max(data, color='yellow'):
'''
highlight the maximum in a Series or DataFrame
'''
attr = 'background-color: {}'.format(color)
if data.ndim == 1: # Series from .apply(axis=0) or axis=1
is_max = data == …Run Code Online (Sandbox Code Playgroud) 我有以下情节:
dfA.plot.bar(stacked=True, color=[colorDict.get(x, '#333333') for x in
dfA.columns],figsize=(10,8))
plt.legend(loc='upper right', bbox_to_anchor=(1.4, 1))
Run Code Online (Sandbox Code Playgroud)
显示这个:
我想删除图表和图例的所有边框,即图表周围的框(留下轴号,如 2015 和 6000 等)
我发现的所有示例都指的是脊椎和“斧头”,但是我还没有使用fig = plt.figure()等构建我的图表。
有谁知道怎么做?
我用 R 制作了一张地图stat_density2d。这是代码:
ggplot(data, aes(x=Lon, y=Lat)) +
stat_density2d(aes(fill = ..level..), alpha=0.5, geom="polygon",show.legend=FALSE)+
geom_point(colour="red")+
geom_path(data=map.df,aes(x=long, y=lat, group=group), colour="grey50")+
scale_fill_gradientn(colours=rev(brewer.pal(7,"Spectral")))+
xlim(-10,+2.5) +
ylim(+47,+60) +
coord_fixed(1.7) +
theme_void()
Run Code Online (Sandbox Code Playgroud)
它产生这个:
伟大的。有用。但我不知道这个传说意味着什么。我确实找到了这个维基百科页面:
https://en.wikipedia.org/wiki/Multivariate_kernel_密度_估计
他们使用的示例(包含红色、橙色和黄色)指出:
彩色轮廓对应于包含相应概率质量的最小区域:红色 = 25%,橙色 + 红色 = 50%,黄色 + 橙色 + 红色 = 75%
然而,使用 stat_密度2d,我的地图中有 11 个等高线。有谁知道 stat_密度2d 是如何工作的以及图例的含义是什么?理想情况下,我希望能够说明诸如红色轮廓包含 25% 的图之类的内容。
我读过这篇文章: https: //ggplot2.tidyverse.org/reference/geom_密度_2d.html,但我仍然一无所知。
我有一个像这样的数据框:
df = data.frame (Ref = c("1", "2", "3", "4"),
start_date = c("01/01/20", "02/04/21", NA, NA),
text = c("foo", NA, "bar", "foo"),
value= c(1000, 7000, 500, 200)
)
Run Code Online (Sandbox Code Playgroud)
我想要一个数据框来计算列中 NA 或 BLANK 的数量并对值列进行总计。
到目前为止,我有以下代码:
naDF = colSums(is.na(df)|df == '')
naDF = data.frame(as.list(naDF))
naDF = melt(naDF)
Run Code Online (Sandbox Code Playgroud)
产生这个:
但我想要另一列来总计这些计数的值列,例如
有什么建议吗?谢谢
我一直在操纵一些数据框,但不幸的是我有两个百分比列,一个格式为'61 .72',另一个格式为'0.62'.
我想将列中的'61 .72'格式的百分比除以100,然后将其舍入为2.dp,以便与数据帧保持一致.
有这么简单的方法吗?
我的数据框有两列,一列叫做'A',另一列叫'B',我想格式化'B'.
非常感谢!
我有一个数据透视图:
FinancialYear 2014/2015 2015/2016 2016/2017 2017/2018
Month
April 42 32 29 27
August 34 28 32 0
December 45 51 28 0
February 28 20 28 0
January 32 28 33 0
July 40 66 31 30
June 32 67 37 35
March 43 36 39 0
May 34 30 24 29
November 39 32 31 0
October 38 39 28 0
September 29 19 34 0
Run Code Online (Sandbox Code Playgroud)
这是我使用的代码:
new_hm01 = hmdf[['FinancialYear','Month','FirstReceivedDate']]
hm05 = new_hm01.pivot_table(index=['FinancialYear','Month'], aggfunc='count')
df_hm = new_hm01.groupby(['Month', 'FinancialYear']).size().unstack(fill_value=0).rename(columns=lambda x: …Run Code Online (Sandbox Code Playgroud) 我在python中用图完成了一个热图。悬浮文本可以完美运行,但是每个变量都以x,y或z为前缀,如下所示:
可以通过任何方式更改此值,即x =“ FY”,y =“ Month”和z =“ Count”
这是产生上面的热图的代码
dfreverse = df_hml.values.tolist()
dfreverse.reverse()
colorscale = [[0, '#454D59'],[0.5, '#FFFFFF'], [1, '#F1C40F']]
trace = go.Heatmap(z=dfreverse,
colorscale = colorscale,
x = [threeYr,twoYr,oneYr,Yr],
y=['March', 'February', 'January', 'December', 'November', 'October', 'September', 'August', 'July', 'June', 'May', 'April'])
data=[trace]
layout = go.Layout(
autosize=False,
font=Font(
family="Courier New",
),
width=700,
height=450,
margin=go.Margin(
l=150,
r=160,
b=50,
t=100,
pad=3
),
)
fig = go.Figure(data=data, layout=layout)
plotly.offline.iplot(fig,filename='pandas-heatmap')
Run Code Online (Sandbox Code Playgroud)
谢谢!
我创建了一个 python 脚本,并使用以下命令将其转换为 .exe 文件:
\n\nPyinstaller \xe2\x80\x93-onefile RFOutputGraphs.py\nRun Code Online (Sandbox Code Playgroud)\n\n它可以工作,但是脚本中的一项作业失败了,尽管它在从 Python 运行时工作得很好。
\n\n我的错误是:
\n\n FileNotFoundError: [Errno 2] no such file or directory:\n 'C:\\\\Users\\\\Nicholas\\\\AppData\\\\Local\\\\Temp\\\\_MEI30362\\\\currency_converter\n \\\\eurofxref-hist.zip'\nRun Code Online (Sandbox Code Playgroud)\n\n我猜它没有识别出什么可能是不寻常的模块(currencyconverter)
\n\n有办法解决这个问题吗?
\n\n谢谢
\n我有一个由groupby创建的数据框:
hmdf = pd.DataFrame(hm01)
new_hm01 = hmdf[['FinancialYear','Month','FirstReceivedDate']]
hm05 = new_hm01.pivot_table(index=['FinancialYear','Month'], aggfunc='count')
vals1 = ['April ', 'May ', 'June ', 'July ', 'August ', 'September', 'October ', 'November ', 'December ', 'January ', 'February ', 'March ']
df_hm = new_hm01.groupby(['Month', 'FinancialYear']).size().unstack(fill_value=0).rename(columns=lambda x: '{}'.format(x))
df_hml = df_hm.reindex(vals1)
Run Code Online (Sandbox Code Playgroud)
DF看起来像这样:
FinancialYear 2014/2015 2015/2016 2016/2017 2017/2018
Month
April 34 24 22 20
May 29 26 21 25
June 19 39 22 20
July 23 39 18 20
August 36 30 34 0
September 35 23 …Run Code Online (Sandbox Code Playgroud)