出现频率

jac*_*ack 2 sed awk perl

我有一个制表符分隔的文本文件,大约有 3K 行。

我想计算其中出现的数据频率,范围为 10,000。

输入.txt

Price  
500    
1500   
10001   
15000  
17000  
25000  
33000  
39000  
:
:
8000000 
Run Code Online (Sandbox Code Playgroud)

输出.txt

Pricerange      pricerangecount  
0-10000          2               
10000-20000      3               
20000-30000      1               
30000-40000      2 
:
:  
Run Code Online (Sandbox Code Playgroud)

dub*_*jim 7

awk 'BEGIN{print "Pricerange\tpricerangecount"}
     NR>1 {cur=int($0/10000); A[cur]+=1; if (cur>m) m=cur; }
     END {for(i=0;i<=m;i++) printf("%d-%d:\t%d\n",i*10000, (i+1)*10000, A[i])}' 
Run Code Online (Sandbox Code Playgroud)