Unix:计算第一列中类似条目的出现次数,对第二列求和

Question

Unix:计算第一列中类似条目的出现次数,对第二列求和

我有一个包含两列数据的文件,我想计算第一列中相似性的出现.当匹配第一列中的两个相似条目时,我还想对两个匹配条目的第二列的值求和.

示例列表:

2013-11-13-03 1
2013-11-13-06 1
2013-11-13-13 2
2013-11-13-13 1
2013-11-13-15 1
2013-11-13-15 1
2013-11-13-15 1
2013-11-13-17 1
2013-11-13-23 1
2013-11-14-01 1
2013-11-14-04 6
2013-11-14-07 1
2013-11-14-08 1
2013-11-14-09 1
2013-11-14-09 1

Run Code Online (Sandbox Code Playgroud)

我希望输出读取类似于以下内容

2013-11-13-03 1 1
2013-11-13-06 1 1
2013-11-13-13 2 3
2013-11-13-15 3 3
2013-11-13-17 1 1
2013-11-13-23 1 1
2013-11-14-01 1 1
2013-11-14-04 1 6
2013-11-14-07 1 1
2013-11-14-08 1 1
2013-11-14-09 2 2

Run Code Online (Sandbox Code Playgroud)

第1列是前面示例第1列中的匹配列,第2列是前一示例中第1列的匹配计数(如果没有其他匹配,则为1),第3列是来自匹配列1的第2列的总和前面的例子.任何人都有使用awk或uniq和awk的混合物完成此任何提示？

Answer 1

dan*_*uzz 5

这是一个快速的awk和sort:

awk '
{
    counts[$1]++;     # Increment count of lines.
    totals[$1] += $2; # Accumulate sum of second column.
}
END {
    # Iterate over all first-column values.
    for (x in counts) {
        print x, counts[x], totals[x];
    }
}
' file.txt | sort

Run Code Online (Sandbox Code Playgroud)

sort如果您不关心输出行的顺序,可以跳过.

归档时间：	11 年，11 月前
查看次数：	994 次
最近记录：	9 年，8 月前