将列值与 dplyr::mutate 中的所有前导值进行比较

Question

将列值与 dplyr::mutate 中的所有前导值进行比较

我有一个由单个向量/列组成的数据：

my_tibble <- tibble(score = c(1,2,3,4,9,8,7,6,5,4))

Run Code Online (Sandbox Code Playgroud)

对于 my_tibble$score 的每一行，我想计算与同一列中最大的“领先”元素的差异。这个新列应称为“差异”。例如，差异的第一行应为 1 - 9，而第五行应为 9 - 8，最后一行将变为 NA，因为没有值落后/低于 4。

最后，新的 tibble 应如下所示：

score | difference
<dbl>   <dbl>
1         -8
2         -7
3         -6
4         -5
9          1
8          1
7          1
6          1
5          1
4         NA

Run Code Online (Sandbox Code Playgroud)

我想使用 dplyr 来实现这一点，到目前为止已经尝试了许多 mutate 变体，例如

my_tibble %>%
 mutate(difference = score[which(score > score)])

Run Code Online (Sandbox Code Playgroud)

希望找到某种方式，使 which 函数中的第二个“分数”指代正在发生变异的当前行。然而，经过数小时的尝试和拼命在网上寻找解决方案后，我没有成功。

我发现的最接近的是dplyr: Summing nleading values，但是这仍然给我留下了一个问题，即我想要与所有主值的最大主值的差异，而不仅仅是最接近的 n 个主值。

非常感谢之前已回答或解决此问题的任何地方的帮助和/或转介！

Answer 1

H 1*_*H 1 3

一种方法是：

library(dplyr)
library(purrr)

my_tibble %>%
  mutate(difference = c(map_dbl(seq_along(score)[-n()], ~ score[.x] - max(score[-(1:.x)])), NA))

# A tibble: 10 x 2
   score difference
   <dbl>      <dbl>
 1     1         -8
 2     2         -7
 3     3         -6
 4     4         -5
 5     9          1
 6     8          1
 7     7          1
 8     6          1
 9     5          1
10     4         NA

Run Code Online (Sandbox Code Playgroud)

归档时间：	5 年，5 月前
查看次数：	117 次
最近记录：	5 年，5 月前