具有相同 ID 的列中值的累积总和

Question

我在表单的文本文件中有数据：

对于具有相同 ID（第一列）的行，我想添加一列，该列将第 2 列中的所有值加到前一行。其中所需的输出：

我即将通过以下方式实现：

awk -v OFS='' 'NR == 1 {
   next
}
{
   print $0, (NR > 1 && p1 == $1 ? " " (sum+=p2) : "")
}
{
   p1 = $1
   p2 = $2
}' input > output

但是，这是对第 2 列中的所有值求和，而不仅仅是具有相同 ID 的值。所以输出对于 ID=1 是正确的，但显然变得更糟：

如何更改我的总和以仅包含正确的部分？（具有相同 ID 的行）

Answer 1

打印当前行后增加计数。

awk '{print $1, $2, sum[$1]; sum[$1] += $2}' file

这利用了 awk 将未定义变量视为空字符串或（在数字上下文中）为零的优势。

如果您不想0打印增量总和，请使用

if ($2 != "") sum[$1] += $2