根据另一列对列进行求和

Mar*_*jer 4 unix linux shell awk

我有一个2列的文件,第1列是HH:MM:SS格式的时间,第2列是计数.
我想总结第2列为基础的第一个库.关于第1列的小时和分钟.

输入:

00:00:00,2.00,
00:00:10,1.00,
00:00:20,2.00,
00:00:30,6.00,
00:00:40,1.00,
00:00:50,7.00,
00:01:00,8.00,
00:01:10,7.00,
00:01:20,8.00,
00:01:30,11.00,
Run Code Online (Sandbox Code Playgroud)

对于小时:下面的awk工作,

 awk -F, '{ a[substr($1,0,2)]+=$2 } END{ for (i in a) print i "," a[i] }' file
Run Code Online (Sandbox Code Playgroud)

输出:

00,53
Run Code Online (Sandbox Code Playgroud)

对于分钟:
无法根据提交的分钟对列进行求和,请提示获得预期结果的方法.

例外输出:

00:00,19
00:01,34
Run Code Online (Sandbox Code Playgroud)

anu*_*ava 6

使用`awk:

awk -F '[:,]' -v OFS=, '{s[$1 ":" $2]+=$(NF-1)} END{for (i in s) print i, s[i]}' file
00:00,19
00:01,34
Run Code Online (Sandbox Code Playgroud)

编辑:如果原始时间戳的排序很重要,那么使用:

awk -F '[:,]' -v OFS=, '{k=$1":"$2} !s[k]{b[++n]=k} {s[k]+=$(NF-1)}
     END {for (i=1; i<=n; i++) print b[i], s[b[i]]}' file
00:00,19
00:01,34
Run Code Online (Sandbox Code Playgroud)

  • 更好的解决方案.您不需要处理格式. (2认同)