小编Kar*_*kar的帖子

熊猫分组城市和月份并填写缺少的月份

我有一个包含多个城市的DataFrame,每个月都有多个值。我需要按城市和月份对这些值进行分组,并用NA填充缺少的月份。

按城市和月份工作分组:

self.probes[['city', 'date', 'value']].groupby(['city',pd.Grouper(key='date', freq='M')])

| Munich   | 2018-06 | values... |
| Munich   | 2018-08 | values... |
| Munich   | 2018-09 | values... |
| New York | 2018-06 | values... |
| New York | 2018-07 | values... |
Run Code Online (Sandbox Code Playgroud)

但是我无法设法弥补缺失的几个月。

| Munich   | 2018-06 | values... |
| Munich   |*2018-07*| NA instead of values |
| Munich   | 2018-08 | values... |
| Munich   | 2018-09 | values... |
| New York | 2018-06 | values... …
Run Code Online (Sandbox Code Playgroud)

python pandas

4
推荐指数
1
解决办法
556
查看次数

对连接的熊猫数据框进行排序

我想连接两个熊猫数据框AB然后按两列对它们进行排序,'geohash'然后'timestamp'

A
    geohash  timestamp
0   a2a      15
1   b3a      14

B
    geohash  timestamp
0   a2b      15
1   b3b      14
Run Code Online (Sandbox Code Playgroud)

AB = pd.concat([A,B],ignore_index=True)
AB.sort_values(['geohash','timestamp'])
Run Code Online (Sandbox Code Playgroud)

我预计

AB
    geohash  timestamp
0   a2a      15
1   a2b      15
2   b3a      14
3   b3b      14
Run Code Online (Sandbox Code Playgroud)

但我得到

AB
    geohash  timestamp
0   a2a      15
1   b3a      14
2   a2b      14
3   b3b      15
Run Code Online (Sandbox Code Playgroud)

为什么大熊猫AB不对整个数据框进行排序?

python sorting concat pandas

2
推荐指数
1
解决办法
3518
查看次数

标签 统计

pandas ×2

python ×2

concat ×1

sorting ×1