deP*_*blo 2 grep text-processing
我需要创建从一个文件中读取行并检查该行是否存在于第二个文件中的脚本。如何处理文件中的特殊字符,例如:'、" 和 \?
第一个文件:
a.txt
aa
bb
cc
f
'f'
"g"
'h'
Run Code Online (Sandbox Code Playgroud)
第二个文件:
b.txt
cc
dd
'f'
"g"
g
h
Run Code Online (Sandbox Code Playgroud)
命令:
cat a.txt | xargs -I{} grep -w {} b.txt
Run Code Online (Sandbox Code Playgroud)
返回:
cc
'f'
'f'
"g"
g <- it shouldn't be there
h <- it shouldn't be there
Run Code Online (Sandbox Code Playgroud)
预期的:
cc
'f'
"g"
Run Code Online (Sandbox Code Playgroud)
在我的情况下,不应列出最后一项 (h),因为该项目不存在于 a.txt 文件中。只有'h'(单引号)。如何以通用方式处理此问题以防止将来出现意外情况?
这就是comm
实用程序的用途。通常,您可以执行此单行操作来对输入文件进行排序并将它们提供给comm
. 该-12
选项的意思是抑制专门为文件1和2中的线,只显示了公共线。
comm -12 <(sort a.txt) <(sort b.txt)
cc
'f'
"g"
Run Code Online (Sandbox Code Playgroud)