为什么 mutate() 和 add_column() 不接受相同的基本参数？

Question

为什么 mutate() 和 add_column() 不接受相同的基本参数？

我经常希望在特定索引处添加一个新列；mutate() 没有简单的实现，而 add_column() 通过 .before 和 .after 参数实现。我希望这两个函数在简单设置中的行为相同，但事实并非如此。下面是将行索引转换为新变量的 MWE。R 文档没有说清楚：为什么这两个函数的基本语法不同？

dat <- as.tibble(matrix(rnorm(1e4), nrow=100))
dat1 <- dat %>% mutate(id=row_number()) # works as expected
dat2 <- dat %>% add_column(id=row_number()) # throws error
dat3 <- dat %>% add_column(id=1:nrow(dat), .before=1) # works, but harder to read

Run Code Online (Sandbox Code Playgroud)

Answer 1

Kev*_*eau 4

如果您检查这两个函数的代码，您会得到一些线索。

dplyr::变异

function (.data, ...) 
{
    UseMethod("mutate")
}
<environment: namespace:dplyr>

Run Code Online (Sandbox Code Playgroud)

标题::添加列

function (.data, ..., .before = NULL, .after = NULL) 
{
    df <- tibble(...)
    if (ncol(df) == 0L) {
        return(.data)
    }
    if (nrow(df) != nrow(.data)) {
        if (nrow(df) == 1) {
            df <- df[rep(1L, nrow(.data)), ]
        }
        else {
            stopc("`.data` must have ", nrow(.data), pluralise_n(" row(s)", 
                nrow(.data)), ", not ", nrow(df))
        }
    }
    extra_vars <- intersect(names(df), names(.data))
    if (length(extra_vars) > 0) {
        stopc(pluralise_msg("Column(s) ", extra_vars), pluralise(" already exist[s]", 
            extra_vars))
    }
    pos <- pos_from_before_after_names(.before, .after, colnames(.data))
    end_pos <- ncol(.data) + seq_len(ncol(df))
    indexes_before <- rlang::seq2(1L, pos)
    indexes_after <- rlang::seq2(pos + 1L, ncol(.data))
    indexes <- c(indexes_before, end_pos, indexes_after)
    .data[end_pos] <- df
    .data[indexes]
}
<environment: namespace:tibble>

Run Code Online (Sandbox Code Playgroud)

首先，您会注意到它们来自两个不同的包，尽管它们都是tidyverse的一部分。

其次，您将看到mutate使用指定的方法，而更多的是用r基语言编写的带有一些rlangadd_column魔法的便利函数。

我不确定这两个包的路线图，但是，我确信如果还没有提出或分叉项目并提供拉取请求，您可以提出增强功能。这将是一个有用的补充。

更新

这已经在tidyverse/dplyr中提出，并且似乎正在开发中，尽管尚未计划。

归档时间：	8 年前
查看次数：	1254 次
最近记录：	8 年前