我想从文件中的句子中删除停用词?
停止词,我的意思是:
[I, a, an, as, at, the, by, in, for, of, on, that]
我在文件中有这些句子my_text.txt:
Unix 系统设计的主要目标之一是创建一个促进高效程序运行的环境。
然后我想从上面的句子中删除停用词
我使用了这个脚本:
array=( I a an as at the by in for of on that )
for i in "${array[@]}"
do
cat $p | sed -e 's/\<$i\>//g'
done < my_text.txt
Run Code Online (Sandbox Code Playgroud)
但输出是:
Unix 系统设计的主要目标之一是创建一个促进高效程序运行的环境。
预期的输出应该是:
设计 Unix 系统的一个主要目标是创建一个促进高效程序的环境
注意:我要删除 删除停用词 不是重复词?