jks*_*hah 4 sorting awk grep sed
我有一个表格式的大数据文件需要分析.主要有两列是我感兴趣的,其中一列包含字母数字字母(列#1),另一列包含百分比数字(列#3).
我的要求是根据第3列的值反向排序数据,应用一些阈值(> 10.0)并且只按排序顺序显示符合此条件的所需行,列#1和列#3.
通常我会编写一个小脚perl本来实现这样的要求.但在这里,我正在寻找一系列linux命令(一个班轮)来快速有效地解决它.
样本输入
abc12 24.5 90.0 5
xyz23 454.23 23.5 2
aa34cd 1.345 12.34 6
uvxy 4.25 54.7 1
pqr3t 235.3 6.05 4
abcd 1.234 4.56 3
Run Code Online (Sandbox Code Playgroud)
期望的输出
abc12 90.0
uvxy 54.7
xyz23 23.5
aa34cd 12.34
Run Code Online (Sandbox Code Playgroud)
如果你能帮助我解决这个问题,那将是很明智的.
我试过了什么?
我可以使用以下命令对#3列进行反向排序.不知道下一步是什么!
awk '{print $3}' test.txt | sort -rn
Run Code Online (Sandbox Code Playgroud)
如果第三个字段大于10,则仅打印第一个和第三个字段,然后在第二个字段上执行数字反向排序:
$ awk '$3>10{print $1,$3}' file | sort -nrk 2
abc12 90.0
uvxy 54.7
xyz23 23.5
aa34cd 12.34
Run Code Online (Sandbox Code Playgroud)