Dar*_*ick 1 python command-line text-processing
给出表格的数据:
a b 1.1
c d 2.3
b a 1.1
Run Code Online (Sandbox Code Playgroud)
是否可以根据thired列对这样的文件进行排序,并删除第三列中的条目重复的行,这样输出将是:
a b 1.1
c d 2.3
Run Code Online (Sandbox Code Playgroud)
要么,
c d 2.3
b a 1.1
Run Code Online (Sandbox Code Playgroud)
.
我只能使用python,R或命令行实用程序在一组非常大的文件上执行此任务.
谢谢!
Unix sort应该能够为你做的工作:
cat file | sort -u -k3,3n a b 1.1 c d 2.3
cat file | sort -u -k3,3rn c d 2.3 a b 1.1
| 归档时间: |
|
| 查看次数: |
510 次 |
| 最近记录: |