如何从另一个文件中的一个文件中查找单词?

ocs*_*gna 8 linux shell awk grep text-manipulation

在一个文本文件中,我有150个单词.我有另一个文本文件,大约有100,000行.

如何检查属于第一个文件的每个单词是否在第二个文件中?

我想过使用grep,但我无法找到如何用它来阅读原文中的每个单词.

有什么方法可以使用awk吗?或另一种解决方案

我试过这个shell脚本,但它几乎匹配每一行:

#!/usr/bin/env sh
cat words.txt | while read line; do  
    if grep -F "$FILENAME" text.txt
    then
        echo "Se encontró $line"
    fi
done
Run Code Online (Sandbox Code Playgroud)

我发现的另一种方式是:

fgrep -w -o -f "words.txt" "text.txt"
Run Code Online (Sandbox Code Playgroud)

anu*_*ava 6

你可以使用grep -f:

grep -Ff "first-file" "second-file"
Run Code Online (Sandbox Code Playgroud)

或者匹配完整的单词:

grep -w -Ff "first-file" "second-file"
Run Code Online (Sandbox Code Playgroud)

更新:根据评论:

awk 'FNR==NR{a[$1]; next} ($1 in a){delete a[$1]; print $1}' file1 file2
Run Code Online (Sandbox Code Playgroud)

  • 这是在寻找字符串,这样很好,但是会将`the`与`theatre`匹配-理想吗? (2认同)