我需要找到文件中每个条目的最大值和最小值:
#subset of my file
NEUTRON 20.900103
PION- 0.215176
PION- 22.716532
NEUTRON 8.043279
PION+ 1.374297
PION- 0.313350
PION+ 0.167848
Run Code Online (Sandbox Code Playgroud)
当有多个条目名称时,如何循环遍历文件并找到每个名称的最小值和最大值。我已经使用 awk 来计算每个条目并且没有重复,但是每个名称的每个重复都包含一个数字,而该数字就是我试图过滤掉每个条目的最大值和最小值的数字。整个文件的 ex 输出:
Name Count Minimum Maximum
-------- ----- --------- ---------
KAON- 1 5.489958 5.489958
NEUTRON 2 8.043279 20.900103
PHOTON 10 0.034664 1.897264
PION- 5 0.192247 22.716532
PION+ 7 0.167848 7.631051
PROTON 1 1.160216 1.160216
Run Code Online (Sandbox Code Playgroud)
awk '{
count[$1]++
min[$1]=(!($1 in min) || $2<min[$1]) ? $2 : min[$1]
max[$1]=(!($1 in max) || $2>max[$1]) ? $2 : max[$1]
}
END {
print "Name","Count","Minimum","Maximum"
print "----","-----","-------","-------"
for(i in count) print i,count[i],min[i],max[i]
}' file | column -t
Run Code Online (Sandbox Code Playgroud)
最小数组值赋值的逻辑是:
如果数组中不存在第一个字段的名称 ( !($1 in min)) 或 ( ||) 第二个字段小于当前数组值 ( $2<min[$1]),则 ( ?) 分配新值$2, else( :) 指定旧值min[$1]。
用于| column -t将结果漂亮地打印为表格。如果您不需要它,可以将其删除。
输出:
Name Count Minimum Maximum
---- ----- ------- -------
PION+ 2 0.167848 1.374297
PION- 3 0.215176 22.716532
NEUTRON 2 8.043279 20.900103
Run Code Online (Sandbox Code Playgroud)