相关疑难解决方法(0)

如何基于数据框中的分组变量创建连续索引

我有一个数据框(all_data),其中我有一个网站列表(1 ...到n)和他们的分数,例如

  site  score
     1    10
     1    11  
     1    12
     4    10 
     4    11
     4    11
     8    9
     8    8
     8    7
Run Code Online (Sandbox Code Playgroud)

我想创建一个列,按照数字顺序对每个级别的站点进行编号,就像一个计数器.在该示例中,站点(1,4和8)将在"数字"列中具有1到3的相应计数器:

site  score number
     1    10    1
     1    11    1 
     1    12    1 
     4    10    2
     4    11    2
     4    11    2
     8    9     3
     8    8     3 
     8    7     3
Run Code Online (Sandbox Code Playgroud)

我相信这一定很容易解决,但我还没有找到办法.

r r-faq

22
推荐指数
5
解决办法
2万
查看次数

R - 按变量分组,然后分配唯一ID

我有兴趣去除具有时间固定和时变值的敏感数据集.我想(a)按社会安全号码对所有案件进行分组,(b)为这些案件分配一个唯一的ID,然后(c)删除社会安全号码.

这是一个示例数据集:

personal_id    gender  temperature
111-11-1111      M        99.6
999-999-999      F        98.2
111-11-1111      M        97.8
999-999-999      F        98.3
888-88-8888      F        99.0
111-11-1111      M        98.9
Run Code Online (Sandbox Code Playgroud)

任何解决方案都将非常感谢.

r dplyr

16
推荐指数
2
解决办法
2万
查看次数

标签 统计

r ×2

dplyr ×1

r-faq ×1