计数文件出现linux

Question

计数文件出现linux

我想计算第3列中每个单词出现的次数.以下是输入

IN A three
US B one
LK C two
US B three
US A one
IN A one
US B three
LK C three
US B two
US A two
IN A two
US B two

Run Code Online (Sandbox Code Playgroud)

输出应如下所示:

IN A three    4
US B one      3
LK C two      5
US B three    4
US A one      3
IN A one      3
US B three    4
LK C three    4
US B two      5
US A two      5
IN A two      5
US B two      5

Run Code Online (Sandbox Code Playgroud)

Answer 1

fed*_*qui 5

这可以是一种方式;

$ awk 'FNR==NR{++a[$3]; next} {print $0, a[$3]}' file file
IN A three 4
US B one 3
LK C two 5
US B three 4
US A one 3
IN A one 3
US B three 4
LK C three 4
US B two 5
US A two 5
IN A two 5
US B two 5

Run Code Online (Sandbox Code Playgroud)

说明

它循环遍历文件两次:首先获取数据,然后打印它.

FNR==NR{++a[$3]; next} 在第一次循环时,记录第3个值出现的次数.
{print $0, a[$3]} 当第二次循环时,打印该行加上计数器值.

要获得更好的输出,您还可以使用printf在第3列之后打印选项卡:

{printf "%s\t%s\n", $0, a[$3]}

Run Code Online (Sandbox Code Playgroud)

就像多次读取同一个文件时的好奇心一样,你可以在大多数shell中将`file file`改为`file {,}`所以这应该工作'awk'FNR == NR {++ a [$ 3]; next} {print $ 0,a [$ 3]}'file {,}`.试试`echo 1 {,,}` (2认同)

归档时间：	11 年，11 月前
查看次数：	96 次
最近记录：	6 年，6 月前