我的字符串是文件路径,如s/14/11/13/15/n7ce49B_235_25ed2d70.jpg
; 我的模式很简单,都喜欢n7ce49B_.+
。
我跑GNU grep 2.6.3
下的Debian 6.0.10对戴尔DL360G7服务器(我说出来,只是给这台机器性能比较的意义上)与15K硬盘,而这个命令:time LC_ALL=C grep -E -f path_to_patterns_file path_to_strings_file
只是无法完成-服务器交换太差。使用 20k 图案需要 3 个多小时。
这对我来说似乎不合理。
还可以使用以下方法测试和调整输入行和模式的数量:
xxd -p /dev/urandom | fold -sw 100 | head -n 1250 |
grep -Ef <(xxd -p /dev/urandom | fold -sw 10 | head -n 20000)
Run Code Online (Sandbox Code Playgroud)