使用与此类似的数据框:
set.seed(100)
df <- data.frame(cat = c(rep("aaa", 5), rep("bbb", 5), rep("ccc", 5)), val = runif(15))
df <- df[order(df$cat, df$val), ]
df
cat val
1 aaa 0.05638315
2 aaa 0.25767250
3 aaa 0.30776611
4 aaa 0.46854928
5 aaa 0.55232243
6 bbb 0.17026205
7 bbb 0.37032054
8 bbb 0.48377074
9 bbb 0.54655860
10 bbb 0.81240262
11 ccc 0.28035384
12 ccc 0.39848790
13 ccc 0.62499648
14 ccc 0.76255108
15 ccc 0.88216552
Run Code Online (Sandbox Code Playgroud)
我想在每个组中添加一个带编号的列.这样做显然不是使用R的权力:
df$num <- 1
for (i in 2:(length(df[,1]))) {
if (df[i,"cat"]==df[(i-1),"cat"]) { …Run Code Online (Sandbox Code Playgroud) 我无法解决这个必须完成的任务。如何获得作为连续数字的组标签。
library(dplyr)
set.seed(1)
df <- data.frame(id = sample(c('a','b'), 20, T),
name = sample(c('N1', 'N2', 'N3'), 20, T),
val = runif(20)) %>%
group_by(id) %>%
arrange(id, name)
Run Code Online (Sandbox Code Playgroud)
我想要的是一个标签group_no,指示name每个iddplyr组中变量的类别数量。我在dplyr软件包本身中找不到解决方案。像这样:
# A tibble: 20 x 4
# Groups: id [2]
id name val group_no
<fct> <fct> <dbl> <int>
1 a N1 0.647 1
2 a N1 0.530 1
3 a N1 0.245 1
4 a N2 0.693 2
5 a N2 0.478 2
6 a N2 0.861 2 …Run Code Online (Sandbox Code Playgroud) 我有这个表
df <- data.table(x = c('a','a','a','a','b','b','b','b'), y = c(4,5,6,3,2,2,6,5))
并且想要枚举组中的元素(x变量).
结果,我想得到 df <- data.table(x = c('a','a','a','a','b','b','b','b'), y = c(4,5,6,3,2,2,6,5), z = c(1,2,3,4,1,2,3,4))