所以我的数据集有一些业务 n 日期的信息,如下所示:
Business Date Value
a 1/1/2017 127
a 2/1/2017 89
b 2/1/2017 122
a 1/1/2018 555
a 2/1/2018 455
Run Code Online (Sandbox Code Playgroud)
我需要以下格式的数据:我如何转置它。我不想在我的输出数据集中多级
Business 1/1/2017 2/1/2017 1/1/2018 2/1/2018
a 127 89 555 455
b N/A 122 N/A N/A
Run Code Online (Sandbox Code Playgroud)
我尝试了以下语法:
df = df.set_index(['Business','Date'])['Value'].unstack()
df=df.pivot(index='Business', columns='Date', values='Value')
Run Code Online (Sandbox Code Playgroud)
我得到如下输出:
Date 1/1/2017 2/1/2017 1/1/2018 2/1/2018
Business
a 454 5555 555 444
b - 444 - -
Run Code Online (Sandbox Code Playgroud)
当我打印列时,它不会将 LOB 显示为列。我的最终数据框还应包括业务、日期字段作为列,以便我可以将此数据框与业务上的另一个数据框连接起来
DYZ*_*DYZ 13
你非常接近你想要的。您所需要的只是删除自定义索引并将其替换为默认索引。
pivoted = df.pivot(index='Business', columns='Date', values='Value')\
.reset_index()
pivoted.columns.name=None
print(pivoted)
# Business 1/1/2017 1/1/2018 2/1/201 2/1/2017
#0 a 127.0 555.0 455.0 99.0
#1 b NaN NaN NaN 122.0
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
21362 次 |
| 最近记录: |