小编Cro*_*ose的帖子

Pandas:旋转数据框并保留额外的非数字列

我有一些列表格式的数据:150 多个组织的数据,每个 12 个月系列的数据。其原始形式如下所示:

Name Size   Date  Figure
Org1 Medium Jun16 8.36
Org1 Medium Jul16 7.55
Org1 Medium Aug16 8.57
...
Org1 Medium May17 9.41
Org2 Large  Jun16 12.12
Org2 Large  Jul16 11.44
...
Run Code Online (Sandbox Code Playgroud)

因此,每个组织都有一个唯一的名称、十二个月的数据以及三种规模之一(小型、中型、大型)。我已经成功地将这些数字转换为每个组织的时间序列,即

Name Jun16 Jul16 Aug16 Sep16 Oct16...
Org1 8.36  7.55  8.57  7.66  9.43
Org2 12.12 11.44 11.01 12.01 10.44...
Run Code Online (Sandbox Code Playgroud)

但我想添加另一列,其中包含每个组织的规模。我用于枢轴的代码是:

dataPivot = dataRaw.pivot_table(index='Name', columns ='Date'],
                              aggfunc='sum', values = 'Figure').fillna(0)
Run Code Online (Sandbox Code Playgroud)

其中dataRaw是从 .csv 读取的原始数据。我尝试过添加'Size'到该columns字段,但这只是为每个尺寸提供了 12 个额外的列!

python pivot-table dataframe pandas

5
推荐指数
1
解决办法
3718
查看次数

标签 统计

dataframe ×1

pandas ×1

pivot-table ×1

python ×1