我有一个文本文件大约。1200 万行,每行由 4 个字段组成(第 1、2、3 和 4 列)
大多数行在第 2 列中都有一个唯一的 STRING。我不想修改这些行中的任何一行。
在文本文件中,我经常在第 2 列中有 2 行具有相同 STRING 的连续行。这在整个文本文件中大约发生 10,000 次。一个例子如下所示:
column1 column2 column3 column4
WT 1 ILS G
WT 2 DSG E
WT 3 WYT S
. . . .
WT 106 AAA X
WT 106 BBB Y
. . . .
WT 2704 CCC X
WT 2704 DDD Y
. . . .
Run Code Online (Sandbox Code Playgroud)
我想达到的目标:
column1 column2 column3 column4
WT 1 ILS G
WT 2 DSG E
WT 3 …
Run Code Online (Sandbox Code Playgroud)