Bja*_*ted 4 microsoft-excel microsoft-excel-2011
我在 excel 中有大量数据列表(250.000+ 行),格式如下:
Number Value1 Date Value2
40325 1 21/01/11 18.10 2
65485 3 22/01/11 16.47 2
40325 9 25/01/11 19.00 0
70912 8 27/01/11 16.43 2
Run Code Online (Sandbox Code Playgroud)
我需要根据第 1 列(数字)删除重复行,并且在 Excel 中使用“数据/删除重复项”执行此操作没有问题,但我需要确保删除日期最早的行,并保留最新的,基于第 3 列(日期)。
在上面的示例中,我需要删除第 1 行并保留第 3 行,因为第 3 行是最新的。
我有 4.800 行重复,因此手动排序/删除将是一项非常耗时的工作。
有什么好的建议吗?以及帮助我的技巧?非常感谢提前:)
诀窍是在使用Remove duplicates
. Excel 始终保留重复行的第一个数据集。删除所有连续行。
在你的情况下:
设置一个辅助列并用数值填充它。从 1 开始并使用自动填充直到我们的表结束
确保您的日期列格式为日期,并且 Excel 将它们识别为日期。否则你的排序将不起作用
选择Custom sort
(取决于您的 Excel 版本)。按日期列从Newest 到 Oldest对整个表格进行排序。这是重要的部分
Remove duplicates
仅使用并选择您的编号列,该列包含检查重复项的条件。取消选择所有其他列
Custom Sort
再次选择并按我们在开头添加的 Helper 列对表格进行排序,以恢复原始行顺序
归档时间: |
|
查看次数: |
81122 次 |
最近记录: |