我有一列显示演出的票证ID的列,(每个家庭成员使用相同的票证ID)我想通过计算票证ID重复多少次来创建一个新的cloumn,即家庭人数。
ticketID
113796
2543
19950
382653
349211
3101297
PC 17562
113503
113503
Run Code Online (Sandbox Code Playgroud)
尝试这个:
In [123]: df = pd.DataFrame({'ticketID':np.random.randint(0, 3, 5)})
In [124]: df
Out[124]:
ticketID
0 1
1 2
2 1
3 1
4 2
In [125]: df['family_size'] = df.ticketID.map(df.ticketID.value_counts())
In [126]: df
Out[126]:
ticketID family_size
0 1 3
1 2 2
2 1 3
3 1 3
4 2 2
Run Code Online (Sandbox Code Playgroud)