删除重复行,并根据日期列保留最新行

Bja*_*ted 4 microsoft-excel microsoft-excel-2011

我在 excel 中有大量数据列表(250.000+ 行),格式如下:

Number  Value1  Date            Value2
40325   1       21/01/11 18.10  2
65485   3       22/01/11 16.47  2
40325   9       25/01/11 19.00  0
70912   8       27/01/11 16.43  2
Run Code Online (Sandbox Code Playgroud)

我需要根据第 1 列(数字)删除重复行,并且在 Excel 中使用“数据/删除重复项”执行此操作没有问题,但我需要确保删除日期最早的行,并保留最新的,基于第 3 列(日期)。

在上面的示例中,我需要删除第 1 行并保留第 3 行,因为第 3 行是最新的。

我有 4.800 行重复,因此手动排序/删除将是一项非常耗时的工作。

有什么好的建议吗?以及帮助我​​的技巧?非常感谢提前:)

nix*_*xda 9

诀窍是在使用Remove duplicates. Excel 始终保留重复行的第一个数据集。删除所有连续行。

在你的情况下:

  1. 设置一个辅助列并用数值填充它。从 1 开始并使用自动填充直到我们的表结束
    在此处输入图片说明

  2. 确保您的日期列格式为日期,并且 Excel 将它们识别为日期。否则你的排序将不起作用

  3. 选择Custom sort(取决于您的 Excel 版本)。按日期列从Newest 到 Oldest对整个表格进行排序。这是重要的部分
    在此处输入图片说明

  4. Remove duplicates仅使用并选择您的编号列,该列包含检查重复项的条件。取消选择所有其他列
    在此处输入图片说明

  5. Custom Sort再次选择并按我们在开头添加的 Helper 列对表格进行排序,以恢复原始行顺序
    在此处输入图片说明