小编Sym*_*ony的帖子

如何使用Python/Pandas从Date字段按月分组

我有一个数据帧df,如下所示:

| date      | Revenue |
|-----------|---------|
| 6/2/2017  | 100     |
| 5/23/2017 | 200     |
| 5/20/2017 | 300     |
| 6/22/2017 | 400     |
| 6/21/2017 | 500     |
Run Code Online (Sandbox Code Playgroud)

我需要按月对上述数据进行分组,以获得输出:

| date | SUM(Revenue) |
|------|--------------|
| May  | 500          |
| June | 1000         |
Run Code Online (Sandbox Code Playgroud)

我试过这段代码,但它不起作用:

df.groupby(month('date')).agg({'Revenue': 'sum'})
Run Code Online (Sandbox Code Playgroud)

我想只使用Pandas或Numpy而不使用其他库

python pandas pandas-groupby

13
推荐指数
3
解决办法
2万
查看次数

如何在没有索引的熊猫中将数据框转换为字典

我有一个数据框df,如下所示:

| name  | coverage |
|-------|----------|
| Jason | 25.1     |
Run Code Online (Sandbox Code Playgroud)

我想将其转换为字典。我在中使用了以下命令pandas

dict=df.to_dict()
Run Code Online (Sandbox Code Playgroud)

的输出dict给了我以下内容:

{'coverage': {0: 25.1}, 'name': {0: 'Jason'}} 
Run Code Online (Sandbox Code Playgroud)

我不希望0在我的输出中。我相信这是由于我的dataframe中的列索引而捕获的df。我应该怎么做才能0在输出中消除(我不希望捕获索引。)预期输出:

{'coverage': 25.1, 'name': 'Jason'} 
Run Code Online (Sandbox Code Playgroud)

python dictionary dataframe pandas

11
推荐指数
3
解决办法
1万
查看次数

如何使用 Python/Pandas 从日期字段按月、日分组

我有一个数据框 df 如下:

| date      | Revenue | Cost |
|-----------|---------|------|
| 6/1/2017  | 100     | 20   |
| 5/21/2017 | 200     | 40   |
| 5/21/2017 | 300     | 60   |
| 6/20/2017 | 400     | 80   |
| 6/1/2017  | 500     | 100  |
Run Code Online (Sandbox Code Playgroud)

我需要按月然后按天对上述数据进行分组以获得输出:

| Month | Day | SUM(Revenue) | SUM(Cost) |
|-------|-----|--------------|-----------|
| May   | 21  | 500          | 100       |
| June  | 1   | 600          | 120       |
| June  | 20  | …
Run Code Online (Sandbox Code Playgroud)

python pandas

5
推荐指数
1
解决办法
2140
查看次数

Python 分区方式

我有以下数据框 df:

| Staff_ID | Join_Date | Time_Stamp |
|----------|-----------|------------|
| 1        | 3/29/2016 | 4/23/2016  |
| 1        | 3/29/2016 | 3/29/2016  |
| 1        | 3/29/2016 | 6/21/2016  |
| 2        | 5/15/2016 | 4/1/2016   |
| 2        | 5/15/2016 | 5/25/2016  |
| 3        | 7/24/2016 | 6/21/2016  |
| 3        | 7/24/2016 | 6/10/2016  |
| 3        | 7/24/2016 | 4/21/2016  |
Run Code Online (Sandbox Code Playgroud)

我想通过“Staff_ID”获取最小和最大“Time_Stamp Date”分区,这样得到的数据帧如下:

| Staff_ID | Join_Date | Time_Stamp | Min_Time_Stamp | Max_Time_Stamp |
|----------|-----------|------------|----------------|----------------| …
Run Code Online (Sandbox Code Playgroud)

python timestamp group-by partition

5
推荐指数
1
解决办法
694
查看次数

计数的python数据透视表

我有一个数据帧df如下:

| id | movie | value |
|----|-------|-------|
| 1  | a     | 0     |
| 2  | a     | 0     |
| 3  | a     | 20    |
| 4  | a     | 0     |
| 5  | a     | 10    |
| 6  | a     | 0     |
| 7  | a     | 20    |
| 8  | b     | 0     |
| 9  | b     | 0     |
| 10 | b     | 30    |
| …
Run Code Online (Sandbox Code Playgroud)

python pivot-table pandas

3
推荐指数
2
解决办法
3875
查看次数

我想展平Pandas DataFrame中的JSON列

我有一个输入数据框df,如下所示:

id  e
1   {"k1":"v1","k2":"v2"}
2   {"k1":"v3","k2":"v4"}
3   {"k1":"v5","k2":"v6"}
Run Code Online (Sandbox Code Playgroud)

我想“展平”列“ e”,这样我得到的数据帧是:

id  e.k1    e.k2
1   v1  v2
2   v3  v4
3   v5  v6
Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点?我尝试使用json_normalize,但没有成功

python json normalize pandas

3
推荐指数
2
解决办法
3116
查看次数