JDY*_*JDY 0 bash shell perl stata
我有一个如下所示的数据文件:
123456, 1623326
123456, 2346525
123457, 2435466
123458, 2564252
123456, 2435145
Run Code Online (Sandbox Code Playgroud)
第一列是"ID" - 一个字符串变量.第二栏对我来说无关紧要.我想结束
123456, 3
123457, 1
123458, 1
Run Code Online (Sandbox Code Playgroud)
其中第二列现在计算原始文件中与第一列中唯一"ID"对应的条目数.
在bash或perl中的任何解决方案都会很棒.即使Stata也会很好,但我认为这在Stata中更难做到.如果有任何不清楚的地方,请告诉我.
在Stata,这只是
contract ID
Run Code Online (Sandbox Code Playgroud)
cut -d',' -f1 in.txt | sort | uniq -c | awk '{print $2 ", " $1}'
Run Code Online (Sandbox Code Playgroud)
给出:
123456, 3
123457, 1
123458, 1
Run Code Online (Sandbox Code Playgroud)