如何拆分以下data.frame
df <- data.frame(var1 = c("a", 1, 2, 3, "a", 1, 2, 3, 4, 5, 6, "a", 1, 2), var2 = 1:14)
Run Code Online (Sandbox Code Playgroud)
进入/组的列表
a 1
1 2
2 3
3 4
a 5
1 6
2 7
3 8
4 9
5 10
6 11
a 12
1 13
2 14
Run Code Online (Sandbox Code Playgroud)
基本上,第1列中的值"a"是我想要分割数据帧的标记/标识符.我知道split函数,但这意味着我必须添加另一列,因为从我的例子中可以看出,组的大小可能会有所不同我不知道如何自动创建这样的虚拟列以满足我的需要.
有什么想法吗?
干杯,
斯文
Das*_*son 11
您可以找到索引向量的哪些值等于"a",然后基于该值创建分组变量,然后使用split.
df[,1] == "a"
# [1] TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE TRUE
#[13] FALSE FALSE
cumsum(df[,1] == "a")
# [1] 1 1 1 1 2 2 2 2 2 2 2 3 3 3
split(df, cumsum(df[,1] == "a"))
#$`1`
# var1 var2
#1 a 1
#2 1 2
#3 2 3
#4 3 4
#
#$`2`
# var1 var2
#5 a 5
#6 1 6
#7 2 7
#8 3 8
#9 4 9
#10 5 10
#11 6 11
#
#$`3`
# var1 var2
#12 a 12
#13 1 13
#14 2 14
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
5183 次 |
| 最近记录: |