计算文件中字段的不同值

Olg*_*aya 25 awk text-processing

我有一个文件包含大约一百万行。在行中,我有一个名为 的字段transactionid,它具有重复的值。我需要做的是清楚地计算它们。

无论一个值重复多少次,它都应该只计算一次。

Nik*_*ley 37

好的,假设您的文件是一个文本文件,字段由逗号分隔符“,”分隔。您还将知道哪个字段'transactionid'的位置。假设您的'transactionid'字段是第 7 个字段。

awk -F ',' '{print $7}' text_file | sort | uniq -c
Run Code Online (Sandbox Code Playgroud)

这将计算第 7 个字段中不同/唯一出现的次数并打印结果。


小智 6

也许不是最时尚的方法,但这应该有效:

awk '{print $1}' your_file | sort | uniq | wc -l
Run Code Online (Sandbox Code Playgroud)

其中$1是要解析的字段对应的数字。