给定此输入表:
pac1 xxx
pac1 yyy
pac1 zzz
pac2 xxx
pac2 uuu
pac3 zzz
pac3 uuu
pac4 zzz
Run Code Online (Sandbox Code Playgroud)
我需要将频率添加到第三列,如下所示:
pac1 xxx 2/3
pac1 yyy 1/3
pac1 zzz 3/3
pac2 xxx 2/2
pac2 uuu 2/2
pac3 zzz 2/2
pac3 uuu 2/2
pac4 zzz 3/1
Run Code Online (Sandbox Code Playgroud)
第一个数字是第二列中出现的次数.
awk '{print $2}' input | sort | uniq -c
Run Code Online (Sandbox Code Playgroud)
斜杠后的数字是第一列的单独出现:
awk '{print $1}' input | sort | uniq -c
Run Code Online (Sandbox Code Playgroud)
我想在awk中使用实现.
编辑:
请修改输出 - 第一列是名称,我需要计算在第一列中出现的uniq名称数量,如:
pac1 xxx 2/4
pac1 yyy 1/4
pac1 zzz 3/4
pac2 xxx 2/4
pac2 …Run Code Online (Sandbox Code Playgroud)