标签: running-count

使用附加列识别重复行

我有以下数据框:

   PplNum  RoomNum  Value
0       1        0    265
1       1       12    170
2       2        0    297
3       2       12     85
4       2        0     41
5       2       12    144
Run Code Online (Sandbox Code Playgroud)

一般来说,PplNumandRoomNum是这样生成的,并且它总是遵循以下格式:

for ppl in [1,2,2]:
    for room in [0, 12]:
        print(ppl, room)
Run Code Online (Sandbox Code Playgroud)
1 0
1 12
2 0
2 12
2 0
2 12
Run Code Online (Sandbox Code Playgroud)

但现在我想要实现的是标记 和 的那些重复组合,PplNum以便RoomNum我可以知道哪些组合是第一次出现,哪些组合是第二次出现,依此类推......所以预期的输出 Dataframe 将是这样的:

    PplNum  RoomNum  Value  C
0       1        0    265  1
1       1       12    170  1
2 …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas running-count

4
推荐指数
1
解决办法
144
查看次数

标签 统计

dataframe ×1

pandas ×1

python ×1

running-count ×1