查找长搜索词还是短搜索词更快?或者它会影响速度吗?换句话说,您是否应该使搜索词尽可能准确?
有超过 100 000 个文件,每个文件包含 20 到 5000 多行数据。通常 grep 仅用于查找搜索词的一个实例。
假设搜索词是SEARCHTERM,它将像这样连续排列:
NAD+DP+1234567890:92++UNIQUE+NAME+SEARCHTERM++12345+FI'
Run Code Online (Sandbox Code Playgroud)
寻找“SEARCH”或“SEARCHTERM”是否更快?假设在这种情况下,我们不关心是否也在其他不相关的行中找到匹配项。
这是我目前的做法:
grep NAD+DP 123* | grep SEARCHTERM
Run Code Online (Sandbox Code Playgroud)
但我发现它仍然很慢。查找数据通常需要大约 3-5 分钟,即使我知道粗略的文件名,这将范围限制为大约 10 000 个文件。
那么,更长或更短的搜索词会有帮助吗?据我所知,grep 寻找一定长度的单词的“块”?