基于特定列的排序,阈值和显示表数据

jks*_*hah 4 sorting awk grep sed

我有一个表格式的大数据文件需要分析.主要有两列是我感兴趣的,其中一列包含字母数字字母(列#1),另一列包含百分比数字(列#3).

我的要求是根据第3列的值反向排序数据,应用一些阈值(> 10.0)并且只按排序顺序显示符合此条件的所需行,列#1和列#3.

通常我会编写一个小脚perl本来实现这样的要求.但在这里,我正在寻找一系列linux命令(一个班轮)来快速有效地解决它.

样本输入

abc12   24.5     90.0    5  
xyz23   454.23   23.5    2
aa34cd  1.345    12.34   6
uvxy    4.25     54.7    1
pqr3t   235.3    6.05    4
abcd    1.234    4.56    3
Run Code Online (Sandbox Code Playgroud)

期望的输出

abc12   90.0
uvxy    54.7
xyz23   23.5
aa34cd  12.34
Run Code Online (Sandbox Code Playgroud)

如果你能帮助我解决这个问题,那将是很明智的.

我试过了什么?

我可以使用以下命令对#3列进行反向排序.不知道下一步是什么!

awk '{print $3}' test.txt | sort -rn
Run Code Online (Sandbox Code Playgroud)

Chr*_*our 5

如果第三个字段大于10,则仅打印第一个和第三个字段,然后在第二个字段上执行数字反向排序:

$ awk '$3>10{print $1,$3}' file | sort -nrk 2
abc12    90.0
uvxy     54.7
xyz23    23.5
aa34cd   12.34
Run Code Online (Sandbox Code Playgroud)