我有一个超过 20k 行的数据框。如下是我的数据框的示例:
df <- data.frame(
ID = c("1234", "edje", "hgt1", "4567", "0900", "wwwl", "yyyt", "5789", "hlkk", "3333"),
group = c("V1", "V1", "V2", "V2", "V2", "V3", "V3", "UN", "UN", "UN")
)
Run Code Online (Sandbox Code Playgroud)
现在我想将此数据帧拆分为 10 个数据帧,或多或少具有相似数量的行,然后我想将具有相同值的行放在同一数据帧的组列中,除了那些显示“UN”的行在组列中,因为这些行应该随机分布在所有 10 个数据帧中。
我想要这样的东西:
df1 <- data.frame(
ID = c("1234", "edje", "5789"),
group = c("V1", "V1", "UN")
)
df2 <- data.frame(
ID = c("hgt1", "4567", "0900", "hlkk"),
group = c("V2", "V2", "V2", "UN")
)
df3 <- data.frame(
ID = c("wwwl", "yyyt", "3333"),
group = c("V3", "V3", "UN") …Run Code Online (Sandbox Code Playgroud)