如何使用R中的dplyr mutate函数来计算运行余额？

Question

如何使用R中的dplyr mutate函数来计算运行余额？

在底部的 MWE 代码中，我尝试在从一行运行到下一行时为每个唯一 id 生成运行余额。例如，运行以下代码时，输出应为：

data2 <- 

 id plusA plusB minusC running_balance  [desired calculation for running balance]
  1     3     5    10              -2   3 + 5 - 10 = -2
  2     4     5     9               0   4 + 5 - 9 = 0
  3     8     5     8               5   8 + 5 - 8 = 5
  3     1     4     7               3   id doesn't change so 5 from above + (1 + 4 - 7) = 3
  3     2     5     6               4   id doesn't change so 3 from above + (2 + 5 - 6) = 4
  5     3     6     5               4   3 + 6 - 5 = 4

Run Code Online (Sandbox Code Playgroud)

下面的MWE指的是，当id从一行到下一行一致时，前一行plusA数量而不是前一行running_balance数量。我已经尝试将以下内容更改为某种形式，lag(running_balance...)但还没有运气。

我正在尝试尽量减少使用过多的软件包。例如，我知道该purrr包提供了一个accumulate()功能，但我宁愿dplyr暂时只坚持使用。有没有一种简单的方法可以做到这一点，mutate()在我的例子中使用 dplyr ？我还尝试摆弄 dplyrcumsum()函数，该函数应该在这里工作，但我不确定如何将它们中的几个串在一起。

MWE代码：

data <- data.frame(id=c(1,2,3,3,3,5), 
                   plusA=c(3,4,8,1,2,3), 
                   plusB=c(5,5,5,4,5,6),
                   minusC = c(10,9,8,7,6,5))

library(dplyr)
data2<- subset(
  data %>% mutate(extra=case_when(id==lag(id) ~ lag(plusA), TRUE ~ 0)) %>%
    mutate(running_balance=plusA+plusB-minusC+extra),
  select = -c(extra)
)

Run Code Online (Sandbox Code Playgroud)

Answer 1

Mon*_*ean 6

使用dplyr：

data %>% 
  mutate(running_balance = plusA + plusB - minusC) %>% 
  group_by(id) %>% 
  mutate(running_balance = cumsum(running_balance)) %>% 
  ungroup()

Run Code Online (Sandbox Code Playgroud)

输出：

# A tibble: 6 x 5
# Groups:   id [4]
     id plusA plusB minusC running_balance
  <dbl> <dbl> <dbl>  <dbl>           <dbl>
1     1     3     5     10              -2
2     2     4     5      9               0
3     3     8     5      8               5
4     3     1     4      7               3
5     3     2     5      6               4
6     5     3     6      5               4

Run Code Online (Sandbox Code Playgroud)

你可以只使用`data %>% group_by(id) %>% mutate(running_balance1 = cumsum(plusA + plusB - minusC))` (3认同)

归档时间：	3 年，11 月前
查看次数：	180 次
最近记录：	3 年，11 月前