计算bash中第一列中具有相同条目的行数

Question

我有一个如下所示的数据文件:

123456, 1623326
123456, 2346525
123457, 2435466
123458, 2564252
123456, 2435145

第一列是"ID" - 一个字符串变量.第二栏对我来说无关紧要.我想结束

123456, 3
123457, 1
123458, 1

其中第二列现在计算原始文件中与第一列中唯一"ID"对应的条目数.

在bash或perl中的任何解决方案都会很棒.即使Stata也会很好,但我认为这在Stata中更难做到.如果有任何不清楚的地方,请告诉我.

Answer 1

在Stata,这只是

contract ID

Answer 2

cut -d',' -f1 in.txt | sort | uniq -c | awk '{print $2 ", " $1}'

给出：

123456, 3
123457, 1
123458, 1