相关疑难解决方法(0)

对数据框中组内的行进行编号

使用与此类似的数据框:

set.seed(100)  
df <- data.frame(cat = c(rep("aaa", 5), rep("bbb", 5), rep("ccc", 5)), val = runif(15))             
df <- df[order(df$cat, df$val), ]  
df  

   cat        val  
1  aaa 0.05638315  
2  aaa 0.25767250  
3  aaa 0.30776611  
4  aaa 0.46854928  
5  aaa 0.55232243  
6  bbb 0.17026205  
7  bbb 0.37032054  
8  bbb 0.48377074  
9  bbb 0.54655860  
10 bbb 0.81240262  
11 ccc 0.28035384  
12 ccc 0.39848790  
13 ccc 0.62499648  
14 ccc 0.76255108  
15 ccc 0.88216552 
Run Code Online (Sandbox Code Playgroud)

我想在每个组中添加一个带编号的列.这样做显然不是使用R的权力:

 df$num <- 1  
 for (i in 2:(length(df[,1]))) {  
   if (df[i,"cat"]==df[(i-1),"cat"]) { …
Run Code Online (Sandbox Code Playgroud)

r dataframe r-faq

136
推荐指数
6
解决办法
8万
查看次数

R:将dplyr组标签添加为数字

我无法解决这个必须完成的任务。如何获得作为连续数字的组标签。

library(dplyr)
set.seed(1)
df <- data.frame(id = sample(c('a','b'), 20, T),
                 name = sample(c('N1', 'N2', 'N3'), 20, T),
                 val = runif(20)) %>%
  group_by(id) %>% 
  arrange(id, name)
Run Code Online (Sandbox Code Playgroud)

我想要的是一个标签group_no,指示name每个iddplyr组中变量的类别数量。我在dplyr软件包本身中找不到解决方案。像这样:

# A tibble: 20 x 4
# Groups:   id [2]
   id    name     val group_no
   <fct> <fct>  <dbl>     <int>
 1 a     N1    0.647          1
 2 a     N1    0.530          1
 3 a     N1    0.245          1
 4 a     N2    0.693          2
 5 a     N2    0.478          2
 6 a     N2    0.861          2 …
Run Code Online (Sandbox Code Playgroud)

grouping r dplyr

2
推荐指数
2
解决办法
954
查看次数

在data.table中枚举group by语句中的元素

我有这个表 df <- data.table(x = c('a','a','a','a','b','b','b','b'), y = c(4,5,6,3,2,2,6,5)) 并且想要枚举组中的元素(x变量).

结果,我想得到 df <- data.table(x = c('a','a','a','a','b','b','b','b'), y = c(4,5,6,3,2,2,6,5), z = c(1,2,3,4,1,2,3,4))

r data.table

0
推荐指数
1
解决办法
485
查看次数

标签 统计

r ×3

data.table ×1

dataframe ×1

dplyr ×1

grouping ×1

r-faq ×1