Python或命令行实用程序 - 排序和过滤文件?

Dar*_*ick 1 python command-line text-processing

给出表格的数据:

a b 1.1
c d 2.3
b a 1.1
Run Code Online (Sandbox Code Playgroud)

是否可以根据thired列对这样的文件进行排序,并删除第三列中的条目重复的行,这样输出将是:

a b 1.1
c d 2.3
Run Code Online (Sandbox Code Playgroud)

要么,

c d 2.3
b a 1.1
Run Code Online (Sandbox Code Playgroud)

.

我只能使用python,R或命令行实用程序在一组非常大的文件上执行此任务.

谢谢!

Mat*_*ttH 8

Unix sort应该能够为你做的工作:

cat file | sort -u -k3,3n
a b 1.1
c d 2.3
cat file | sort -u -k3,3rn
c d 2.3
a b 1.1

  • @Dominik:怎么回事? (4认同)