考虑到仅列中的文本，如何删除重复的行？

Question

考虑到仅列中的文本，如何删除重复的行？

我有以下文件：

ICR1 +
ICR1+1+3199 +
ICR1+2526+2828 +
IRT1 +
IRT1+1+1489 +
IRT1+713+937 +
LSR1 -
LSR1+1+1175 -
LSR1+366+638 -
NME1 +
NME1+1+340 +
NME1+2+118 +
PWR1 -
PWR1+1+941 -
PWR1+724+939 -
Q0017 -
Q0017+1+162 -
Q0020 -
Q0020+1370+1513 -
Q0020+1+440 -

Run Code Online (Sandbox Code Playgroud)

第一列和第二列以制表符分隔。我确实需要以下内容：

ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Run Code Online (Sandbox Code Playgroud)

我尝试将 awk 与字段分隔符“+”一起使用，但它也从第二列中删除了 + ......

Answer 1

ste*_*ver 5

您可以将 awk 的字段分隔符设置为空格或+，然后执行基于经典关联数组的重复数据删除：

$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，10 月前
查看次数：	53 次
最近记录：	6 年，10 月前