获取行子集的最有效方法

Question

我有两个文件。一个巨大的（200.000+ 行）称为“db”，一个巨大的（15.000+ 行）称为“索引”。

从“索引”中过滤掉包含任何索引（行上的任何位置）的“db”中的行的最快方法是什么？

我能想到的解决方案是

for index in $(cat indices); do
  grep $index db >> selection
done;

但这需要很长时间。

在 bash 和 linux 中有更快的方法吗？

Answer 1

fgrep -f indices db

应该更快。