小编Sco*_*tEU的帖子

如何重命名 Python Pandas 中的索引行？

我了解如何重命名列，但我想重命名数据框中的索引（行名称）。

我有一个包含 350 行的表格，然后我在底部添加了总数。然后我删除了除最后一行之外的每一行。

-------------------------------------------------
|            |     A      |     B     |     C    |
-------------------------------------------------
|     TOTAL  |    1243    |       423 |     23   |
-------------------------------------------------

Run Code Online (Sandbox Code Playgroud)

所以我有名为“总计”的行，然后是几列。我想将“总计”一词重命名为其他名称。

这甚至可能吗？

非常感谢

python pandas

Sco*_*tEU

lucky-day

5
推荐指数

2
解决办法

2万
查看次数

Python Pandas - 突出显示列中的最大值

我有一个由此代码生成的数据框:

hmdf = pd.DataFrame(hm01)
new_hm02 = hmdf[['FinancialYear','Month']]
new_hm01 = hmdf[['FinancialYear','Month','FirstReceivedDate']]

hm05 = new_hm01.pivot_table(index=['FinancialYear','Month'], aggfunc='count')
vals1 = ['April    ', 'May      ', 'June     ', 'July     ', 'August   ', 'September', 'October  ', 'November ', 'December ', 'January  ', 'February ', 'March    ']

df_hm = new_hm01.groupby(['Month', 'FinancialYear']).size().unstack(fill_value=0).rename(columns=lambda x: '{}'.format(x))
df_hml = df_hm.reindex(vals1)

Run Code Online (Sandbox Code Playgroud)

然后我有一个功能来突出显示每列中的最大值:

def highlight_max(data, color='yellow'):
    '''
    highlight the maximum in a Series or DataFrame
    '''
    attr = 'background-color: {}'.format(color)
    if data.ndim == 1:  # Series from .apply(axis=0) or axis=1
        is_max = data == …

Run Code Online (Sandbox Code Playgroud)

python pandas

Sco*_*tEU

lucky-day

5
推荐指数

2
解决办法

3465
查看次数

Python - 从图表和图例中删除边框

我有以下情节：

dfA.plot.bar(stacked=True, color=[colorDict.get(x, '#333333') for x in 
dfA.columns],figsize=(10,8))
plt.legend(loc='upper right', bbox_to_anchor=(1.4, 1))

Run Code Online (Sandbox Code Playgroud)

显示这个：

我想删除图表和图例的所有边框，即图表周围的框（留下轴号，如 2015 和 6000 等）

我发现的所有示例都指的是脊椎和“斧头”，但是我还没有使用fig = plt.figure()等构建我的图表。

有谁知道怎么做？

python matplotlib

Sco*_*tEU

lucky-day

5
推荐指数

1
解决办法

9419
查看次数

stat_密度2d - 图例是什么意思？

我用 R 制作了一张地图stat_density2d。这是代码：

ggplot(data, aes(x=Lon, y=Lat)) + 
  stat_density2d(aes(fill = ..level..), alpha=0.5, geom="polygon",show.legend=FALSE)+
  geom_point(colour="red")+
  geom_path(data=map.df,aes(x=long, y=lat, group=group), colour="grey50")+
  scale_fill_gradientn(colours=rev(brewer.pal(7,"Spectral")))+
  xlim(-10,+2.5) +
  ylim(+47,+60) +
  coord_fixed(1.7) +
  theme_void()

Run Code Online (Sandbox Code Playgroud)

它产生这个：

伟大的。有用。但我不知道这个传说意味着什么。我确实找到了这个维基百科页面：

https://en.wikipedia.org/wiki/Multivariate_kernel_密度_估计

他们使用的示例（包含红色、橙色和黄色）指出：

彩色轮廓对应于包含相应概率质量的最小区域：红色 = 25%，橙色 + 红色 = 50%，黄色 + 橙色 + 红色 = 75%

然而，使用 stat_密度2d，我的地图中有 11 个等高线。有谁知道 stat_密度2d 是如何工作的以及图例的含义是什么？理想情况下，我希望能够说明诸如红色轮廓包含 25% 的图之类的内容。

我读过这篇文章： https: //ggplot2.tidyverse.org/reference/geom_密度_2d.html，但我仍然一无所知。

r stat-density2d

Sco*_*tEU

2018 11-06

5
推荐指数

1
解决办法

4376
查看次数

R - 计算数据框中的行数，列中包含 NA/"" 和总值列

我有一个像这样的数据框：

df = data.frame (Ref  = c("1", "2", "3", "4"),
                  start_date = c("01/01/20", "02/04/21", NA, NA),
                  text = c("foo", NA, "bar", "foo"),
                  value= c(1000, 7000, 500, 200)
                  )

Run Code Online (Sandbox Code Playgroud)

我想要一个数据框来计算列中 NA 或 BLANK 的数量并对值列进行总计。

到目前为止，我有以下代码：

naDF = colSums(is.na(df)|df == '')
naDF = data.frame(as.list(naDF))
naDF = melt(naDF)

Run Code Online (Sandbox Code Playgroud)

产生这个：

但我想要另一列来总计这些计数的值列，例如

有什么建议吗？谢谢

Sco*_*tEU

lucky-day

5
推荐指数

2
解决办法

85
查看次数

熊猫Python - 将列除以100(然后舍入2.dp)

我一直在操纵一些数据框,但不幸的是我有两个百分比列,一个格式为'61 .72',另一个格式为'0.62'.

我想将列中的'61 .72'格式的百分比除以100,然后将其舍入为2.dp,以便与数据帧保持一致.

有这么简单的方法吗？

我的数据框有两列,一列叫做'A',另一列叫'B',我想格式化'B'.

非常感谢!

python pandas

Sco*_*tEU

lucky-day

4
推荐指数

2
解决办法

5942
查看次数

按列表对索引进行排序-Python Pandas

我有一个数据透视图：

FinancialYear   2014/2015   2015/2016   2016/2017   2017/2018
Month               
April             42           32          29          27
August            34           28          32           0
December          45           51          28           0
February          28           20          28           0
January           32           28          33           0
July              40           66          31          30
June              32           67          37          35
March             43           36          39           0
May               34           30          24          29
November          39           32          31           0
October           38           39          28           0
September         29           19          34           0

Run Code Online (Sandbox Code Playgroud)

这是我使用的代码：

new_hm01 = hmdf[['FinancialYear','Month','FirstReceivedDate']]

hm05 = new_hm01.pivot_table(index=['FinancialYear','Month'], aggfunc='count')

df_hm = new_hm01.groupby(['Month', 'FinancialYear']).size().unstack(fill_value=0).rename(columns=lambda x: …

Run Code Online (Sandbox Code Playgroud)

python pandas

Sco*_*tEU

lucky-day

4
推荐指数

1
解决办法

4571
查看次数

密谋Python-热图-更改悬浮文本（x，y，z）

我在python中用图完成了一个热图。悬浮文本可以完美运行，但是每个变量都以x，y或z为前缀，如下所示：

可以通过任何方式更改此值，即x =“ FY”，y =“ Month”和z =“ Count”

这是产生上面的热图的代码

dfreverse = df_hml.values.tolist()
dfreverse.reverse()

colorscale = [[0, '#454D59'],[0.5, '#FFFFFF'], [1, '#F1C40F']]

trace = go.Heatmap(z=dfreverse,
                   colorscale = colorscale,
                   x = [threeYr,twoYr,oneYr,Yr],
                   y=['March', 'February', 'January', 'December', 'November', 'October', 'September', 'August', 'July', 'June', 'May', 'April'])
data=[trace]



layout = go.Layout(
    autosize=False,
    font=Font(
        family="Courier New",
    ),
    width=700,
    height=450,
    margin=go.Margin(
        l=150,
        r=160,
        b=50,
        t=100,
        pad=3
    ),
)

fig = go.Figure(data=data, layout=layout)
plotly.offline.iplot(fig,filename='pandas-heatmap')

Run Code Online (Sandbox Code Playgroud)

谢谢！

python plotly

Sco*_*tEU

lucky-day

4
推荐指数

1
解决办法

1496
查看次数

Pyinstaller - FileNotFound 错误

我创建了一个 python 脚本，并使用以下命令将其转换为 .exe 文件：

\n\n

Pyinstaller \xe2\x80\x93-onefile RFOutputGraphs.py\n

Run Code Online (Sandbox Code Playgroud)\n\n

它可以工作，但是脚本中的一项作业失败了，尽管它在从 Python 运行时工作得很好。

\n\n

我的错误是：

\n\n

      FileNotFoundError: [Errno 2] no such file or directory:\n     'C:\\\\Users\\\\Nicholas\\\\AppData\\\\Local\\\\Temp\\\\_MEI30362\\\\currency_converter\n     \\\\eurofxref-hist.zip'\n

Run Code Online (Sandbox Code Playgroud)\n\n

我猜它没有识别出什么可能是不寻常的模块（currencyconverter）

\n\n

有办法解决这个问题吗？

\n\n

谢谢

python pyinstaller

Sco*_*tEU

lucky-day

4
推荐指数

1
解决办法

8419
查看次数

Python Pandas - 在Groupby DF上将列转换为百分比

我有一个由groupby创建的数据框:

hmdf = pd.DataFrame(hm01)
new_hm01 = hmdf[['FinancialYear','Month','FirstReceivedDate']]

hm05 = new_hm01.pivot_table(index=['FinancialYear','Month'], aggfunc='count')
vals1 = ['April    ', 'May      ', 'June     ', 'July     ', 'August   ', 'September', 'October  ', 'November ', 'December ', 'January  ', 'February ', 'March    ']

df_hm = new_hm01.groupby(['Month', 'FinancialYear']).size().unstack(fill_value=0).rename(columns=lambda x: '{}'.format(x))
df_hml = df_hm.reindex(vals1)

Run Code Online (Sandbox Code Playgroud)

DF看起来像这样:

FinancialYear   2014/2015   2015/2016   2016/2017   2017/2018
Month               
April               34          24          22          20
May                 29          26          21          25
June                19          39          22          20
July                23          39          18          20
August              36          30          34           0
September           35          23 …

Run Code Online (Sandbox Code Playgroud)

python pandas

Sco*_*tEU

2017 08-09

3
推荐指数

1
解决办法

1万
查看次数