小编Sym*_*ony的帖子

如何使用Python/Pandas从Date字段按月分组

我有一个数据帧df,如下所示:

| date      | Revenue |
|-----------|---------|
| 6/2/2017  | 100     |
| 5/23/2017 | 200     |
| 5/20/2017 | 300     |
| 6/22/2017 | 400     |
| 6/21/2017 | 500     |

Run Code Online (Sandbox Code Playgroud)

我需要按月对上述数据进行分组,以获得输出:

| date | SUM(Revenue) |
|------|--------------|
| May  | 500          |
| June | 1000         |

Run Code Online (Sandbox Code Playgroud)

我试过这段代码,但它不起作用:

df.groupby(month('date')).agg({'Revenue': 'sum'})

Run Code Online (Sandbox Code Playgroud)

我想只使用Pandas或Numpy而不使用其他库

python pandas pandas-groupby

Sym*_*ony

lucky-day

13
推荐指数

3
解决办法

2万
查看次数

如何在没有索引的熊猫中将数据框转换为字典

我有一个数据框df，如下所示：

| name  | coverage |
|-------|----------|
| Jason | 25.1     |

Run Code Online (Sandbox Code Playgroud)

我想将其转换为字典。我在中使用了以下命令pandas：

dict=df.to_dict()

Run Code Online (Sandbox Code Playgroud)

的输出dict给了我以下内容：

{'coverage': {0: 25.1}, 'name': {0: 'Jason'}}

Run Code Online (Sandbox Code Playgroud)

我不希望0在我的输出中。我相信这是由于我的dataframe中的列索引而捕获的df。我应该怎么做才能0在输出中消除（我不希望捕获索引。）预期输出：

{'coverage': 25.1, 'name': 'Jason'}

Run Code Online (Sandbox Code Playgroud)

python dictionary dataframe pandas

Sym*_*ony

2018 09-28

11
推荐指数

3
解决办法

1万
查看次数

如何使用 Python/Pandas 从日期字段按月、日分组

我有一个数据框 df 如下：

| date      | Revenue | Cost |
|-----------|---------|------|
| 6/1/2017  | 100     | 20   |
| 5/21/2017 | 200     | 40   |
| 5/21/2017 | 300     | 60   |
| 6/20/2017 | 400     | 80   |
| 6/1/2017  | 500     | 100  |

Run Code Online (Sandbox Code Playgroud)

我需要按月然后按天对上述数据进行分组以获得输出：

| Month | Day | SUM(Revenue) | SUM(Cost) |
|-------|-----|--------------|-----------|
| May   | 21  | 500          | 100       |
| June  | 1   | 600          | 120       |
| June  | 20  | …

Run Code Online (Sandbox Code Playgroud)

python pandas

Sym*_*ony

lucky-day

5
推荐指数

1
解决办法

2140
查看次数

Python 分区方式

我有以下数据框 df：

| Staff_ID | Join_Date | Time_Stamp |
|----------|-----------|------------|
| 1        | 3/29/2016 | 4/23/2016  |
| 1        | 3/29/2016 | 3/29/2016  |
| 1        | 3/29/2016 | 6/21/2016  |
| 2        | 5/15/2016 | 4/1/2016   |
| 2        | 5/15/2016 | 5/25/2016  |
| 3        | 7/24/2016 | 6/21/2016  |
| 3        | 7/24/2016 | 6/10/2016  |
| 3        | 7/24/2016 | 4/21/2016  |

Run Code Online (Sandbox Code Playgroud)

我想通过“Staff_ID”获取最小和最大“Time_Stamp Date”分区，这样得到的数据帧如下：

| Staff_ID | Join_Date | Time_Stamp | Min_Time_Stamp | Max_Time_Stamp |
|----------|-----------|------------|----------------|----------------| …

Run Code Online (Sandbox Code Playgroud)

python timestamp group-by partition

Sym*_*ony

lucky-day

5
推荐指数

1
解决办法

694
查看次数

计数的python数据透视表

我有一个数据帧df如下:

| id | movie | value |
|----|-------|-------|
| 1  | a     | 0     |
| 2  | a     | 0     |
| 3  | a     | 20    |
| 4  | a     | 0     |
| 5  | a     | 10    |
| 6  | a     | 0     |
| 7  | a     | 20    |
| 8  | b     | 0     |
| 9  | b     | 0     |
| 10 | b     | 30    |
| …

Run Code Online (Sandbox Code Playgroud)

python pivot-table pandas

Sym*_*ony

2017 11-16

3
推荐指数

2
解决办法

3875
查看次数

我想展平Pandas DataFrame中的JSON列

我有一个输入数据框df，如下所示：

id  e
1   {"k1":"v1","k2":"v2"}
2   {"k1":"v3","k2":"v4"}
3   {"k1":"v5","k2":"v6"}

Run Code Online (Sandbox Code Playgroud)

我想“展平”列“ e”，这样我得到的数据帧是：

id  e.k1    e.k2
1   v1  v2
2   v3  v4
3   v5  v6

Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点？我尝试使用json_normalize，但没有成功

python json normalize pandas

Sym*_*ony

lucky-day

3
推荐指数

2
解决办法

3116
查看次数

标签统计

python ×6

pandas ×5

dataframe ×1

dictionary ×1

group-by ×1

json ×1

normalize ×1

pandas-groupby ×1

partition ×1

pivot-table ×1

timestamp ×1

如何使用Python/Pandas从Date字段按月分组

如何在没有索引的熊猫中将数据框转换为字典

如何使用 Python/Pandas 从日期字段按月、日分组

Python 分区方式

计数的python数据透视表

我想展平Pandas DataFrame中的JSON列

标签 统计

小编Sym_ony的帖子

标签统计