这里,如果第二个值相同,则认为两行是冗余的.是否有任何unix/linux命令可以实现以下功能.
1 aa
2 aa
1 ss
3 dd
4 dd
Run Code Online (Sandbox Code Playgroud)
结果
1 aa
1 ss
3 dd
Run Code Online (Sandbox Code Playgroud)
我通常使用以下命令,但它没有实现我想要的.
sort -k2 /Users/fahim/Desktop/delnow2.csv | uniq
Run Code Online (Sandbox Code Playgroud)
编辑:
我的文件大约有2500万行:使用@Steve建议的解决方案的时间:33秒.
$date; awk -F '\t' '!a[$2]++' myfile.txt > outfile.txt; date
Wed Nov 27 18:00:16 EST 2013
Wed Nov 27 18:00:49 EST 2013
Run Code Online (Sandbox Code Playgroud)
排序和独特是花费太多时间.等了5分钟后我退出了.
也许这就是你要找的东西:
awk -F "\t" '!a[$2]++' file
Run Code Online (Sandbox Code Playgroud)
结果:
1 aa
1 ss
3 dd
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
314 次 |
| 最近记录: |