如何计算每个唯一条目的最大值和最小值

fgd*_*ark 1 awk numeric-data

我需要找到文件中每个条目的最大值和最小值:

#subset of my file
NEUTRON   20.900103
PION-      0.215176
PION-     22.716532
NEUTRON    8.043279
PION+      1.374297
PION-      0.313350
PION+      0.167848
Run Code Online (Sandbox Code Playgroud)

当有多个条目名称时,如何循环遍历文件并找到每个名称的最小值和最大值。我已经使用 awk 来计算每个条目并且没有重复,但是每个名称的每个重复都包含一个数字,而该数字就是我试图过滤掉每个条目的最大值和最小值的数字。整个文件的 ex 输出:

Name         Count     Minimum        Maximum        
--------     -----     ---------      ---------      
KAON-            1      5.489958       5.489958      
NEUTRON          2      8.043279      20.900103      
PHOTON          10      0.034664       1.897264       
PION-            5      0.192247      22.716532       
PION+            7      0.167848       7.631051       
PROTON           1      1.160216       1.160216       
Run Code Online (Sandbox Code Playgroud)

Fre*_*ddy 5

awk '{
  count[$1]++
  min[$1]=(!($1 in min) || $2<min[$1]) ? $2 : min[$1]
  max[$1]=(!($1 in max) || $2>max[$1]) ? $2 : max[$1]
}
END {
  print "Name","Count","Minimum","Maximum"
  print "----","-----","-------","-------"
  for(i in count) print i,count[i],min[i],max[i]
}' file | column -t
Run Code Online (Sandbox Code Playgroud)

最小数组值赋值的逻辑是:
如果数组中不存在第一个字段的名称 ( !($1 in min)) 或 ( ||) 第二个字段小于当前数组值 ( $2<min[$1]),则 ( ?) 分配新值$2, else( :) 指定旧值min[$1]

用于| column -t将结果漂亮地打印为表格。如果您不需要它,可以将其删除。

输出:

Name     Count  Minimum   Maximum
----     -----  -------   -------
PION+    2      0.167848  1.374297
PION-    3      0.215176  22.716532
NEUTRON  2      8.043279  20.900103
Run Code Online (Sandbox Code Playgroud)