根据部分行比较删除重复行

Question

我有一个包含数千行文本的文本文件,如下所示.

123 hello world
124 foo bar
125 hello world

我想通过检查该行的子部分来测试重复项.对于上面它应该输出:

123 hello world
124 foo bar

是否有可以执行此操作的vim命令？

更新:我在Windows机器上,所以不能使用uniq

Answer 1

这是一个bash命令:

sort -k2 input | uniq -s4

在vim中,您可以调用上面的外部命令:

:%!sort -k2 % | uniq -s4

实际上,您可以使用以下命令在vim中进行排序:

:sort /^\d*\s/

排序后,使用此命令删除重复的行:

:%s/\v(^\d*\s(.*)$\n)(^\d*\s\2$\n)+/\1/