我正在尝试从包含 Outlook 中存档的 .PST 文件的单个文件夹中删除数百个重复的 .PST 文件。我尝试过几个重复删除器应用程序,它们依靠校验和来确定等效性,得到相同的结果:明显重复的文件具有不同的校验和。我被引导相信仅仅拥有不同的标题不应该改变校验和。是什么导致了不同的校验和?
.PST 目录中显示重复项的文件子集:
12/15/2021 09:01 AM 96,011,264 11_SonyArchiveFolderBackup Repaired (2).pst
12/15/2021 09:01 AM 96,011,264 11_SonyArchiveFolderBackup Repaired.pst
12/15/2021 09:01 AM 111,756,288 11_SonyArchiveFolderBackup.pst
12/15/2021 09:01 AM 271,360 12-4_Inbox - Copy (2).pst
12/15/2021 09:01 AM 271,360 12-4_Inbox - Copy (3).pst
12/15/2021 09:01 AM 271,360 12-4_Inbox.pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (10).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (11).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (12).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (13).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (14).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (2).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (3).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (4).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (5).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (6).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (7).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (8).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup (9).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup - Copy (2).pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup - Copy (3).pst
12/15/2021 09:02 AM 15,508,480 12_SonyPersonalFolderBackup Repaired (2).pst
12/15/2021 09:02 AM 15,508,480 12_SonyPersonalFolderBackup Repaired.pst
12/15/2021 09:02 AM 21,857,280 12_SonyPersonalFolderBackup.pst
12/15/2021 09:02 AM 525,312 13-6_Inbox - Copy (2).pst
12/15/2021 09:02 AM 525,312 13-6_Inbox - Copy (3).pst
12/15/2021 09:02 AM 525,312 13-6_Inbox.pst
12/15/2021 09:03 AM 145,785,856 13_DellEmailBackup (2).pst
12/15/2021 09:03 AM 145,785,856 13_DellEmailBackup (3).pst
12/15/2021 09:03 AM 145,785,856 13_DellEmailBackup (4).pst
12/15/2021 09:04 AM 145,785,856 13_DellEmailBackup (5).pst
12/15/2021 09:04 AM 145,785,856 13_DellEmailBackup - Copy (194117045).pst
Run Code Online (Sandbox Code Playgroud)
在我看来,标题为“SonyPersonalFolderBackup (*).pst”的档案显然是原始档案的副本。请注意,字节数相等。
我不被允许发布每个文件的不同校验和的确认,但是,相信我,它们是不同的。
为什么会这样?除了基于名称之外,什么重复删除策略可以帮助我删除它们?
谢谢
明显重复的文件具有不同的校验和。
如果它们具有不同的校验和,则它们显然不重复。
不同的文件有可能具有相同的校验和(事实上,由于校验和的数量是有限的,但可能的文件的数量是无限的,因此必须有无限数量的不同文件具有相同的校验和)。但相同的文件不可能具有不同的校验和。
是什么导致了不同的校验和?
校验和不同的原因是文件不同,而不是重复。
在我看来,标题为“SonyPersonalFolderBackup (*).pst”的档案显然是原始档案的副本。请注意,字节数相等。
包含该字符串的文件hello和包含该字符串的文件的字节数bybye也相等,但显然,两者并不相同。
为什么会这样?除了基于名称之外,什么重复删除策略可以帮助我删除它们?
首先,您需要定义“重复”的含义。显然,您对“重复”的定义与您正在使用的工具的定义不同(可能使用“重复”意味着“相同”的定义)。由于您认为文件是明显不相同的重复文件,因此您需要定义您认为的重复文件。
如果您不知道什么是“重复”,那么您也无法定义知道这一点的命令。