填充数据框中缺少的组合

Question

填充数据框中缺少的组合

我的示例数据集：

df <- data.frame(
 REGION = c("REGION A", "REGION A", "REGION B"), 
 CATEGORY = c("A", "B", "B"), 
 VALUE1 = c(2,3,4),
 VALUE2 = c(1,2,3)
)

Run Code Online (Sandbox Code Playgroud)

结果：

  REGION    CATEGORY VALUE1 VALUE2
1 REGION A   A             2     1
2 REGION A   B             3     2
3 REGION B   B             4     3

Run Code Online (Sandbox Code Playgroud)

现在我希望数据集中未考虑的 REGION 和 CATEGORY 的每个组合都填充为 0 的 VALUE1 和 VALUE2。结果df应该是：

      REGION   CATEGORY VALUE1 VALUE2
    1 REGION A  A          2      1
    2 REGION A  B          3      2
    3 REGION B  A          4      3
    4 REGION B  B          0      0

Run Code Online (Sandbox Code Playgroud)

我已经为它编写了一个大函数，它生成一个带有 for 循环的动态字符串，但我觉得有一种更简单的方法可以只用几行代码来完成。我想我想得太复杂了。有任何想法吗？先感谢您。

Answer 1

Flo*_*ian 5

complete从 tidyr使用：

library(tidyr)
as.data.frame(complete(df,REGION,CATEGORY,fill=list(VALUE1=0,VALUE2=0)))

Run Code Online (Sandbox Code Playgroud)

输出：

    REGION CATEGORY VALUE1 VALUE2
1 REGION A        A      2      1
2 REGION A        B      3      2
3 REGION B        A      0      0
4 REGION B        B      4      3

Run Code Online (Sandbox Code Playgroud)

如果有很多变量，您也可以在之后执行as.data.frame(complete(df,REGION,CATEGORY))并替换NA's 。

希望这可以帮助！

归档时间：	8 年，1 月前
查看次数：	1144 次
最近记录：	5 年，7 月前