groupby/sum第一列中的所有列都相同awk

Question

groupby/sum第一列中的所有列都相同awk

我有一个文件,其中有n列(不知道提前有多少列).我需要对具有相同column1值的列进行求和并打印它们.除第一列外,所有列均为数字.例如

FILE1.TXT

col1 col2 col3 ... colN
val1 3000 1000 ... 5000 
val2 3000 1000 ... 5000
val1 1000 2000 ... 3000

Run Code Online (Sandbox Code Playgroud)

预期产量:

col1 col2 col3 ... colN
val1 4000 3000 ... 8000 
val2 3000 1000 ... 5000

Run Code Online (Sandbox Code Playgroud)

我试过了:

awk '{sums[$1] += $2} END { for (i in sums) printf("%s %s\n", i, sums[i])}' file1.txt | sort

Run Code Online (Sandbox Code Playgroud)

这仅打印前两列.我需要添加并打印所有列.

Answer 1

Ken*_*ent 6

这应该工作:

awk 'NR==1{print;next}
    {b[$1];for(i=2;i<=NF;i++)a[$1,i]+=$i}
    END{for(x in b){
            printf "%s ",x;
            for(i=2;i<=NF;i++)
                printf "%s" (i==NF?"\n":" "),a[x,i]}}' file

Run Code Online (Sandbox Code Playgroud)

与您的数据:

kent$  cat f
col1 col2 col3 colN
val1 3000 1000 5000 
val2 3000 1000 5000
val1 1000 2000 3000

kent$  awk 'NR==1{print;next}
        {b[$1];for(i=2;i<=NF;i++)a[$1,i]+=$i}
        END{for(x in b){printf "%s ",x;
                        for(i=2;i<=NF;i++)
                           printf "%s" (i==NF?"\n":" "),a[x,i]}}' f
col1 col2 col3 colN
val1 4000 3000 8000
val2 3000 1000 5000

Run Code Online (Sandbox Code Playgroud)

归档时间：	12 年前
查看次数：	398 次
最近记录：	12 年前