我有数百个带有各种列表元素的文本文件(以千计).下面给出了三个简化的代表文件(这里的行元素为颜色).
group1.txt
red
blue
red
green
pink
red
Run Code Online (Sandbox Code Playgroud)
group2.txt
yellow
brown
cyan
yellow
brown
red
violet
orange
Run Code Online (Sandbox Code Playgroud)
group3.txt
orange
violet
pink
cyan
grey
Run Code Online (Sandbox Code Playgroud)
我可以用以下脚本创建一个排序计数表 -
awk -F '\t' '{print $1}' * | sort | uniq -c | sort -nr
Run Code Online (Sandbox Code Playgroud)
>
4 red
2 yellow
2 violet
2 pink
2 orange
2 cyan
2 brown
1 grey
1 green
1 blue
Run Code Online (Sandbox Code Playgroud)
我想创建一个列联表如下 -
Colour group1 group2 group3
red 3 1 0
green 1 0 0
blue 0 0 0
yellow 0 …Run Code Online (Sandbox Code Playgroud)