相关疑难解决方法(0)

如何使用shell脚本从句子中删除停用词?

我想从文件中的句子中删除停用词?

停止词,我的意思是:
[I, a, an, as, at, the, by, in, for, of, on, that]

我在文件中有这些句子my_text.txt

Unix 系统设计的主要目标之一是创建一个促进高效程序运行的环境。

然后我想从上面的句子中删除停用词

我使用了这个脚本:

array=( I a an as at the by in for of on that  )
for i in "${array[@]}"
do
cat $p  | sed -e 's/\<$i\>//g' 
done < my_text.txt
Run Code Online (Sandbox Code Playgroud)

但输出是:

Unix 系统设计的主要目标之一是创建一个促进高效程序运行的环境。

预期的输出应该是:

设计 Unix 系统的一个主要目标是创建一个促进高效程序的环境

注意:我要删除 删除停用词 不是重复词?

bash shell sed tr

5
推荐指数
1
解决办法
554
查看次数

标签 统计

bash ×1

sed ×1

shell ×1

tr ×1