我编写了一个脚本来检查进程是否在 Ubuntu 服务器(14.04)上运行,它工作正常,但在测试它时,我发现它不包括在其他终端中运行的 top 命令计数
内容 check-process.sh
#!/bin/sh
OK=1
CRITICAL=0
PROCESS_NUM=$( ps -ef | grep $1 | grep -v "grep "|grep -v "sh"|wc -l )
#echo $PROCESS_NUM
if [ $PROCESS_NUM = $OK ]
then
echo "OK"
elif [ $PROCESS_NUM = $CRITICAL ]
then
echo "CRITICAL"
elif [ $PROCESS_NUM > $OK ]
then
echo "MULTIPLE process are runing"
else
echo "error"
fi
Run Code Online (Sandbox Code Playgroud)
我top在两个终端中运行命令,并按如下方式运行此脚本:
./check-process.sh top
Run Code Online (Sandbox Code Playgroud)
输出是0 CRITICAL,但是当我运行正常命令时,ps -ef |grep -v "grep "| wc -l它给出了两个计数。
正如在对该问题的评论中指出的那样,测试 with>不进行算术比较,而是进行词典比较(2 > 100例如,这是真的),而仅在[[ ... ]]. 在[ ... ]它是一个普通的输出重定向操作符。
该grep -v "grep "和grep -v "sh"过滤也可以从筛选出合法进程ps输出(例如,如果你想使用你的脚本的grep过程)。
以下脚本实现了相同的逻辑,但使用了pgrep:
#!/bin/bash
cmd=$1
pids=( $( pgrep "$cmd" ) )
case "${#pids[@]}" in
0) echo 'No such process' ;;
1) echo 'One such process' ;;
*) echo 'Many such processes'
esac
Run Code Online (Sandbox Code Playgroud)
如果您top在另一个终端中运行一个命令,运行此脚本top作为其参数将报告One such process. top在两个终端中运行将使其报告Many such processes。
使用变量,就像您使用的一样:
#!/bin/bash
cmd=$1
pids=( $( pgrep "$cmd" ) )
critical=0
ok=1
case "${#pids[@]}" in
$critical) echo 'No such process' ;;
$ok) echo 'One such process' ;;
*) echo 'Many such processes'
esac
Run Code Online (Sandbox Code Playgroud)
该脚本将返回的 PID 保存pgrep到一个数组中(这就是为什么这是一个bash脚本而不是sh脚本的原因),然后针对数组的长度进行测试。
以下是对 的改编sh:
#!/bin/sh
cmd=$1
set -- $( pgrep "$cmd" )
critical=0
ok=1
case "$#" in
$critical) echo 'No such process' ;;
$ok) echo 'One such process' ;;
*) echo 'Many such processes'
esac
Run Code Online (Sandbox Code Playgroud)
此sh脚本使用我们可以访问的唯一数组,即位置参数数组。这些(位置参数)被设置为由pgrepwith生成的 PID ,set并且它们的数量来自$#.