我正在使用sort
命令对我从这个站点下载的 rockyou.txt 词表进行排序:
% sort rockyou.txt > rockyou_sorted.txt
Run Code Online (Sandbox Code Playgroud)
然而,当我再检查这两个文件的文件大小,它们之间的区别,在 排序文件更小:
% du -shk rockyou_sorted.txt rockyou.txt
147520 rockyou_sorted.txt
148304 rockyou.txt
Run Code Online (Sandbox Code Playgroud)
有趣的是,当我使用从这里下载的干净版本的rockyou.txt wordlist 重复这些相同的步骤时,我得到了相反的结果,即排序后的文件更大:
% sort rockyou_cleaned.txt > rockyou_cleaned_sorted.txt
% du -shk rockyou_cleaned_sorted.txt rockyou_cleaned.txt
114752 rockyou_cleaned_sorted.txt
102104 rockyou_cleaned.txt
Run Code Online (Sandbox Code Playgroud)
我想知道这是为什么?有人可以为我解释一下吗?难道我做错了什么?我认为两个文件,排序后的文件和原始文件的大小应该相同,不是吗?
更新 1,根据以下 Francesco Lucianò 的评论:使用此sort
命令和 -o 参数
% sort rockyou.txt -o rockyou_sorted_sO.txt
% du -shk rockyou_sorted_sO.txt rockyou.txt
147996 /Users/Martin/Downloads/rockyou_sorted_sO.txt
148304 /Users/Martin/Downloads/rockyou.txt
Run Code Online (Sandbox Code Playgroud)
排序后的文件仍然比原始文件小,但没有我使用sort
上面的命令版本时那么多。
所有文件中的行数相同:
% wc -l rockyou_sorted_sO.txt rockyou_sorted.txt …
Run Code Online (Sandbox Code Playgroud)