小编Jus*_*ASM的帖子

为非常大的文件查找单个正则表达式

file.xml是一个 74G 的大文件,我必须尽快对其进行 grep 单个正则表达式。我正在尝试使用 GNU 来做到这一点parallel

parallel --pipe --block 10M --ungroup LC_ALL=C grep -iF "test.*pattern" < file.xml
Run Code Online (Sandbox Code Playgroud)
  1. --pipepart由于它比 更快,我如何通过使用来实现它--pipe

  2. 通过增加或减少块的大小(例如 20M 而不是 10M,或者 10M 而不是 20M),它会变得更快吗?

regex xml bash gnu-parallel

5
推荐指数
1
解决办法
401
查看次数

标签 统计

bash ×1

gnu-parallel ×1

regex ×1

xml ×1