我有一个数据框(all_data),其中我有一个网站列表(1 ...到n)和他们的分数,例如
site score
1 10
1 11
1 12
4 10
4 11
4 11
8 9
8 8
8 7
Run Code Online (Sandbox Code Playgroud)
我想创建一个列,按照数字顺序对每个级别的站点进行编号,就像一个计数器.在该示例中,站点(1,4和8)将在"数字"列中具有1到3的相应计数器:
site score number
1 10 1
1 11 1
1 12 1
4 10 2
4 11 2
4 11 2
8 9 3
8 8 3
8 7 3
Run Code Online (Sandbox Code Playgroud)
我相信这一定很容易解决,但我还没有找到办法.
我有兴趣去除具有时间固定和时变值的敏感数据集.我想(a)按社会安全号码对所有案件进行分组,(b)为这些案件分配一个唯一的ID,然后(c)删除社会安全号码.
这是一个示例数据集:
personal_id gender temperature
111-11-1111 M 99.6
999-999-999 F 98.2
111-11-1111 M 97.8
999-999-999 F 98.3
888-88-8888 F 99.0
111-11-1111 M 98.9
Run Code Online (Sandbox Code Playgroud)
任何解决方案都将非常感谢.