使用 dplyr 有条件地将列中的值替换为另一列中的值

Rya*_*yan 1 r dplyr tidyverse

我非常努力地寻找这个问题的答案,如果它是重复的,我深表歉意。

我将制作一些虚拟数据来解释我的问题。

tibble(a=c(0.1, 0.2, 0.3), sample1 = c(0, 1, 1), sample2 = c(1, 1, 0))

# A tibble: 3 x 3
      a sample1 sample2
 <dbl>   <dbl>   <dbl>
1   0.1       0       1
2   0.2       1       1
3   0.3       1       0
Run Code Online (Sandbox Code Playgroud)

如何有条件地更改Sample1Sample2列中的值,以便如果它们等于 1,则它们采用a的值。

生成的 tibble 应该如下所示:

# A tibble: 3 x 3
      a sample1 sample2
 <dbl>   <dbl>   <dbl>
1   0.1       0     0.1
2   0.2     0.2     0.2
3   0.3     0.3       0
Run Code Online (Sandbox Code Playgroud)

理想情况下,我不想对每个单独的示例列执行此操作(我有 >100 个示例列),因此循环列的方法会更好(尽管我知道循环是魔鬼)。

感谢您的帮助!

Psi*_*dom 5

您可以mutate_at使用ifelse

df %>% mutate_at(vars(starts_with('sample')), funs(ifelse(. == 1, a, .)))

# A tibble: 3 x 3
#      a sample1 sample2
#  <dbl>   <dbl>   <dbl>
#1   0.1     0.0     0.1
#2   0.2     0.2     0.2
#3   0.3     0.3     0.0
Run Code Online (Sandbox Code Playgroud)

vars(starts_with('sample'))匹配以 开头的所有列sample并将mutate_at函数应用于funs(ifelse(. == 1, a, .))每列;.代表此处匹配的列。


如果您确定所有示例列仅包含10,则可以将其缩短为:

df %>% mutate_at(vars(starts_with('sample')), funs(. * a))

# A tibble: 3 x 3
#      a sample1 sample2
#  <dbl>   <dbl>   <dbl>
#1   0.1     0.0     0.1
#2   0.2     0.2     0.2
#3   0.3     0.3     0.0
Run Code Online (Sandbox Code Playgroud)