我正在尝试使用 shell 脚本将文件中的句子拆分为单独的行。
现在我想用 !, 分割字符串。或者 。. 输出应该是这样的:
我想从my_text.txt读取并包含的文件
you want to learn shell script? First, you want to learn Linux command! then. you can learn shell script.
现在我想用“!”或“?”或“。”分割字符串。输出应该是这样的:
Run Code Online (Sandbox Code Playgroud)you want to learn shell script First, you want to learn Linux command then you can learn shell script
我使用了这个脚本:
while read p
do
echo $p | tr "? ! ." "\n "
done < my_text.txt
Run Code Online (Sandbox Code Playgroud)
但输出是:
你想学习shell脚本
首先,你想学习Linux命令然后你可以学习shell脚本
有人可以帮忙吗?
我已经安装了PyCharm以在Windows 10上使用Python语言。
我正在尝试从 PyCharm 中的 Linux 命令执行命令,我使用了以下代码:
import subprocess
subprocess.run("cat",shell=True,text=True)
Run Code Online (Sandbox Code Playgroud)
但我收到此错误:
'cat' 不是内部或外部命令,也不是可运行的程序或批处理文件。
我想执行多个命令,例如这个示例,但所有命令都会引发相同的错误。如何解决这个问题?
我有两个句子包含重复的单词,例如,文件中的输入数据my_text.txt:
Unix 和 Linux 操作系统。
Unix 和 Linux 系统是为了创造一个促进高效程序的环境。
我使用了这个脚本:
while read p
do
echo "$p"|sort -u | uniq
done < my_text.txt
Run Code Online (Sandbox Code Playgroud)
但输出与输入文件的内容相同:
Unix 和 Linux 操作系统。Unix 和 Linux 系统是为了创造一个促进高效程序的环境
如何从两个句子中删除重复的单词?
我想从文件中的句子中删除停用词?
停止词,我的意思是:
[I, a, an, as, at, the, by, in, for, of, on, that]
我在文件中有这些句子my_text.txt:
Unix 系统设计的主要目标之一是创建一个促进高效程序运行的环境。
然后我想从上面的句子中删除停用词
我使用了这个脚本:
array=( I a an as at the by in for of on that )
for i in "${array[@]}"
do
cat $p | sed -e 's/\<$i\>//g'
done < my_text.txt
Run Code Online (Sandbox Code Playgroud)
但输出是:
Unix 系统设计的主要目标之一是创建一个促进高效程序运行的环境。
预期的输出应该是:
设计 Unix 系统的一个主要目标是创建一个促进高效程序的环境
注意:我要删除 删除停用词 不是重复词?