我有一个数据帧df,如下所示:
| date | Revenue |
|-----------|---------|
| 6/2/2017 | 100 |
| 5/23/2017 | 200 |
| 5/20/2017 | 300 |
| 6/22/2017 | 400 |
| 6/21/2017 | 500 |
Run Code Online (Sandbox Code Playgroud)
我需要按月对上述数据进行分组,以获得输出:
| date | SUM(Revenue) |
|------|--------------|
| May | 500 |
| June | 1000 |
Run Code Online (Sandbox Code Playgroud)
我试过这段代码,但它不起作用:
df.groupby(month('date')).agg({'Revenue': 'sum'})
Run Code Online (Sandbox Code Playgroud)
我想只使用Pandas或Numpy而不使用其他库
我有一个数据框df,如下所示:
| name | coverage |
|-------|----------|
| Jason | 25.1 |
Run Code Online (Sandbox Code Playgroud)
我想将其转换为字典。我在中使用了以下命令pandas:
dict=df.to_dict()
Run Code Online (Sandbox Code Playgroud)
的输出dict给了我以下内容:
{'coverage': {0: 25.1}, 'name': {0: 'Jason'}}
Run Code Online (Sandbox Code Playgroud)
我不希望0在我的输出中。我相信这是由于我的dataframe中的列索引而捕获的df。我应该怎么做才能0在输出中消除(我不希望捕获索引。)预期输出:
{'coverage': 25.1, 'name': 'Jason'}
Run Code Online (Sandbox Code Playgroud) 我有一个数据框 df 如下:
| date | Revenue | Cost |
|-----------|---------|------|
| 6/1/2017 | 100 | 20 |
| 5/21/2017 | 200 | 40 |
| 5/21/2017 | 300 | 60 |
| 6/20/2017 | 400 | 80 |
| 6/1/2017 | 500 | 100 |
Run Code Online (Sandbox Code Playgroud)
我需要按月然后按天对上述数据进行分组以获得输出:
| Month | Day | SUM(Revenue) | SUM(Cost) |
|-------|-----|--------------|-----------|
| May | 21 | 500 | 100 |
| June | 1 | 600 | 120 |
| June | 20 | …Run Code Online (Sandbox Code Playgroud) 我有以下数据框 df:
| Staff_ID | Join_Date | Time_Stamp |
|----------|-----------|------------|
| 1 | 3/29/2016 | 4/23/2016 |
| 1 | 3/29/2016 | 3/29/2016 |
| 1 | 3/29/2016 | 6/21/2016 |
| 2 | 5/15/2016 | 4/1/2016 |
| 2 | 5/15/2016 | 5/25/2016 |
| 3 | 7/24/2016 | 6/21/2016 |
| 3 | 7/24/2016 | 6/10/2016 |
| 3 | 7/24/2016 | 4/21/2016 |
Run Code Online (Sandbox Code Playgroud)
我想通过“Staff_ID”获取最小和最大“Time_Stamp Date”分区,这样得到的数据帧如下:
| Staff_ID | Join_Date | Time_Stamp | Min_Time_Stamp | Max_Time_Stamp |
|----------|-----------|------------|----------------|----------------| …Run Code Online (Sandbox Code Playgroud) 我有一个数据帧df如下:
| id | movie | value |
|----|-------|-------|
| 1 | a | 0 |
| 2 | a | 0 |
| 3 | a | 20 |
| 4 | a | 0 |
| 5 | a | 10 |
| 6 | a | 0 |
| 7 | a | 20 |
| 8 | b | 0 |
| 9 | b | 0 |
| 10 | b | 30 |
| …Run Code Online (Sandbox Code Playgroud) 我有一个输入数据框df,如下所示:
id e
1 {"k1":"v1","k2":"v2"}
2 {"k1":"v3","k2":"v4"}
3 {"k1":"v5","k2":"v6"}
Run Code Online (Sandbox Code Playgroud)
我想“展平”列“ e”,这样我得到的数据帧是:
id e.k1 e.k2
1 v1 v2
2 v3 v4
3 v5 v6
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点?我尝试使用json_normalize,但没有成功
python ×6
pandas ×5
dataframe ×1
dictionary ×1
group-by ×1
json ×1
normalize ×1
partition ×1
pivot-table ×1
timestamp ×1