小编Pea*_*ior的帖子

我将合并多个CSV文件。我想做的是：

1）从文件中删除重复的行，但是，我需要检查多列作为构成重复项的标准。我怎么做？

2）然后创建第二个输出文件以查看被删除的内容，以防万一删除了不应该删除的内容。

3）创建一个项目列表作为输入文件来运行（如果此行在此特定列中包含此单词，则删除整个行。

如果有人可以通过命令帮助我，那就太好了！如果需要澄清，请告诉我。

以下是数据外观的示例（以下是建议的示例）：

我有一个这样的csv文件：

column1    column2

john       kerry
adam       stephenson
ashley     hudson
john       kerry
etc..

我想从此文件中删除重复项，以仅获取1处的问题：

column1    column2

john       kerry
adam       stephenson
ashley     hudson

对于问题3，我想获取第二个列表...表示第一个列表的输出并进一步整理此列表。我想要一个像input.txt这样的文件，其中包含：

adam

然后，最终输出将是：

column1    column2

john       kerry
ashley     hudson

因此，示例中的input.txt文件包含单词adam（通过这种方式，我可以列出一长串单词来检查input.txt文件）。对于＃3，我需要一个代码片段，它将检查所有单词输入文件的CSV所有行的第1列，然后从csv中删除所有匹配项。

2
推荐指数

1
解决办法

4169
查看次数

csv ×1

小编Pea_ior的帖子