小编Sco*_*tEU的帖子

如何重命名 Python Pandas 中的索引行?

我了解如何重命名列,但我想重命名数据框中的索引(行名称)。

我有一个包含 350 行的表格,然后我在底部添加了总数。然后我删除了除最后一行之外的每一行。

-------------------------------------------------
|            |     A      |     B     |     C    |
-------------------------------------------------
|     TOTAL  |    1243    |       423 |     23   |
-------------------------------------------------
Run Code Online (Sandbox Code Playgroud)

所以我有名为“总计”的行,然后是几列。我想将“总计”一词重命名为其他名称。

这甚至可能吗?

非常感谢

python pandas

5
推荐指数
2
解决办法
2万
查看次数

Python Pandas - 突出显示列中的最大值

我有一个由此代码生成的数据框:

hmdf = pd.DataFrame(hm01)
new_hm02 = hmdf[['FinancialYear','Month']]
new_hm01 = hmdf[['FinancialYear','Month','FirstReceivedDate']]

hm05 = new_hm01.pivot_table(index=['FinancialYear','Month'], aggfunc='count')
vals1 = ['April    ', 'May      ', 'June     ', 'July     ', 'August   ', 'September', 'October  ', 'November ', 'December ', 'January  ', 'February ', 'March    ']

df_hm = new_hm01.groupby(['Month', 'FinancialYear']).size().unstack(fill_value=0).rename(columns=lambda x: '{}'.format(x))
df_hml = df_hm.reindex(vals1)
Run Code Online (Sandbox Code Playgroud)

然后我有一个功能来突出显示每列中的最大值:

def highlight_max(data, color='yellow'):
    '''
    highlight the maximum in a Series or DataFrame
    '''
    attr = 'background-color: {}'.format(color)
    if data.ndim == 1:  # Series from .apply(axis=0) or axis=1
        is_max = data == …
Run Code Online (Sandbox Code Playgroud)

python pandas

5
推荐指数
2
解决办法
3465
查看次数

Python - 从图表和图例中删除边框

我有以下情节:

dfA.plot.bar(stacked=True, color=[colorDict.get(x, '#333333') for x in 
dfA.columns],figsize=(10,8))
plt.legend(loc='upper right', bbox_to_anchor=(1.4, 1))
Run Code Online (Sandbox Code Playgroud)

显示这个:

在此处输入图片说明

我想删除图表和图例的所有边框,即图表周围的框(留下轴号,如 2015 和 6000 等)

我发现的所有示例都指的是脊椎和“斧头”,但是我还没有使用fig = plt.figure()等构建我的图表。

有谁知道怎么做?

python matplotlib

5
推荐指数
1
解决办法
9419
查看次数

stat_密度2d - 图例是什么意思?

我用 R 制作了一张地图stat_density2d。这是代码:

ggplot(data, aes(x=Lon, y=Lat)) + 
  stat_density2d(aes(fill = ..level..), alpha=0.5, geom="polygon",show.legend=FALSE)+
  geom_point(colour="red")+
  geom_path(data=map.df,aes(x=long, y=lat, group=group), colour="grey50")+
  scale_fill_gradientn(colours=rev(brewer.pal(7,"Spectral")))+
  xlim(-10,+2.5) +
  ylim(+47,+60) +
  coord_fixed(1.7) +
  theme_void()
Run Code Online (Sandbox Code Playgroud)

它产生这个:

英国地图

伟大的。有用。但我不知道这个传说意味着什么。我确实找到了这个维基百科页面:

https://en.wikipedia.org/wiki/Multivariate_kernel_密度_估计

他们使用的示例(包含红色、橙色和黄色)指出:

彩色轮廓对应于包含相应概率质量的最小区域:红色 = 25%,橙色 + 红色 = 50%,黄色 + 橙色 + 红色 = 75%

然而,使用 stat_密度2d,我的地图中有 11 个等高线。有谁知道 stat_密度2d 是如何工作的以及图例的含义是什么?理想情况下,我希望能够说明诸如红色轮廓包含 25% 的图之类的内容。

我读过这篇文章: https: //ggplot2.tidyverse.org/reference/geom_密度_2d.html,但我仍然一无所知。

r stat-density2d

5
推荐指数
1
解决办法
4376
查看次数

R - 计算数据框中的行数,列中包含 NA/"" 和总值列

我有一个像这样的数据框:

df = data.frame (Ref  = c("1", "2", "3", "4"),
                  start_date = c("01/01/20", "02/04/21", NA, NA),
                  text = c("foo", NA, "bar", "foo"),
                  value= c(1000, 7000, 500, 200)
                  )
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

我想要一个数据框来计算列中 NA 或 BLANK 的数量并对值列进行总计。

到目前为止,我有以下代码:

naDF = colSums(is.na(df)|df == '')
naDF = data.frame(as.list(naDF))
naDF = melt(naDF)
Run Code Online (Sandbox Code Playgroud)

产生这个:

在此输入图像描述

但我想要另一列来总计这些计数的值列,例如

在此输入图像描述

有什么建议吗?谢谢

r

5
推荐指数
2
解决办法
85
查看次数

熊猫Python - 将列除以100(然后舍入2.dp)

我一直在操纵一些数据框,但不幸的是我有两个百分比列,一个格式为'61 .72',另一个格式为'0.62'.

我想将列中的'61 .72'格式的百分比除以100,然后将其舍入为2.dp,以便与数据帧保持一致.

有这么简单的方法吗?

我的数据框有两列,一列叫做'A',另一列叫'B',我想格式化'B'.

非常感谢!

python pandas

4
推荐指数
2
解决办法
5942
查看次数

按列表对索引进行排序-Python Pandas

我有一个数据透视图:

FinancialYear   2014/2015   2015/2016   2016/2017   2017/2018
Month               
April             42           32          29          27
August            34           28          32           0
December          45           51          28           0
February          28           20          28           0
January           32           28          33           0
July              40           66          31          30
June              32           67          37          35
March             43           36          39           0
May               34           30          24          29
November          39           32          31           0
October           38           39          28           0
September         29           19          34           0
Run Code Online (Sandbox Code Playgroud)

这是我使用的代码:

new_hm01 = hmdf[['FinancialYear','Month','FirstReceivedDate']]

hm05 = new_hm01.pivot_table(index=['FinancialYear','Month'], aggfunc='count')

df_hm = new_hm01.groupby(['Month', 'FinancialYear']).size().unstack(fill_value=0).rename(columns=lambda x: …
Run Code Online (Sandbox Code Playgroud)

python pandas

4
推荐指数
1
解决办法
4571
查看次数

密谋Python-热图-更改悬浮文本(x,y,z)

我在python中用图完成了一个热图。悬浮文本可以完美运行,但是每个变量都以x,y或z为前缀,如下所示:

在此处输入图片说明

可以通过任何方式更改此值,即x =“ FY”,y =“ Month”和z =“ Count”

这是产生上面的热图的代码

dfreverse = df_hml.values.tolist()
dfreverse.reverse()

colorscale = [[0, '#454D59'],[0.5, '#FFFFFF'], [1, '#F1C40F']]

trace = go.Heatmap(z=dfreverse,
                   colorscale = colorscale,
                   x = [threeYr,twoYr,oneYr,Yr],
                   y=['March', 'February', 'January', 'December', 'November', 'October', 'September', 'August', 'July', 'June', 'May', 'April'])
data=[trace]



layout = go.Layout(
    autosize=False,
    font=Font(
        family="Courier New",
    ),
    width=700,
    height=450,
    margin=go.Margin(
        l=150,
        r=160,
        b=50,
        t=100,
        pad=3
    ),
)

fig = go.Figure(data=data, layout=layout)
plotly.offline.iplot(fig,filename='pandas-heatmap')
Run Code Online (Sandbox Code Playgroud)

谢谢!

python plotly

4
推荐指数
1
解决办法
1496
查看次数

Pyinstaller - FileNotFound 错误

我创建了一个 python 脚本,并使用以下命令将其转换为 .exe 文件:

\n\n
Pyinstaller \xe2\x80\x93-onefile RFOutputGraphs.py\n
Run Code Online (Sandbox Code Playgroud)\n\n

它可以工作,但是脚本中的一项作业失败了,尽管它在从 Python 运行时工作得很好。

\n\n

我的错误是:

\n\n
      FileNotFoundError: [Errno 2] no such file or directory:\n     'C:\\\\Users\\\\Nicholas\\\\AppData\\\\Local\\\\Temp\\\\_MEI30362\\\\currency_converter\n     \\\\eurofxref-hist.zip'\n
Run Code Online (Sandbox Code Playgroud)\n\n

我猜它没有识别出什么可能是不寻常的模块(currencyconverter)

\n\n

有办法解决这个问题吗?

\n\n

谢谢

\n

python pyinstaller

4
推荐指数
1
解决办法
8419
查看次数

Python Pandas - 在Groupby DF上将列转换为百分比

我有一个由groupby创建的数据框:

hmdf = pd.DataFrame(hm01)
new_hm01 = hmdf[['FinancialYear','Month','FirstReceivedDate']]

hm05 = new_hm01.pivot_table(index=['FinancialYear','Month'], aggfunc='count')
vals1 = ['April    ', 'May      ', 'June     ', 'July     ', 'August   ', 'September', 'October  ', 'November ', 'December ', 'January  ', 'February ', 'March    ']

df_hm = new_hm01.groupby(['Month', 'FinancialYear']).size().unstack(fill_value=0).rename(columns=lambda x: '{}'.format(x))
df_hml = df_hm.reindex(vals1)
Run Code Online (Sandbox Code Playgroud)

DF看起来像这样:

FinancialYear   2014/2015   2015/2016   2016/2017   2017/2018
Month               
April               34          24          22          20
May                 29          26          21          25
June                19          39          22          20
July                23          39          18          20
August              36          30          34           0
September           35          23 …
Run Code Online (Sandbox Code Playgroud)

python pandas

3
推荐指数
1
解决办法
1万
查看次数

标签 统计

python ×8

pandas ×5

r ×2

matplotlib ×1

plotly ×1

pyinstaller ×1

stat-density2d ×1