我编写了一个脚本来从HDFS并行获取数据,然后我在for循环中等待这些子进程,但有时它会返回"pid不是这个shell的子代".有时,它运作良好.令人费解.我使用"jobs -l"来显示在后台运行的所有作业.我确信这些pid是shell进程的子进程,我使用"ps aux"来确保这些pid是注释分配给其他进程.这是我的剧本.
PID=()
FILE=()
let serial=0
while read index_tar
do
echo $index_tar | grep index > /dev/null 2>&1
if [[ $? -ne 0 ]]
then
continue
fi
suffix=`printf '%03d' $serial`
mkdir input/output_$suffix
$HADOOP_HOME/bin/hadoop fs -cat $index_tar | tar zxf - -C input/output_$suffix \
&& mv input/output_$suffix/index_* input/output_$suffix/index &
PID[$serial]=$!
FILE[$serial]=$index_tar
let serial++
done < file.list
for((i=0;i<$serial;i++))
do
wait ${PID[$i]}
if [[ $? -ne 0 ]]
then
LOG "get ${FILE[$i]} failed, PID:${PID[$i]}"
exit -1
else
LOG "get ${FILE[$i]} success, PID:${PID[$i]}" …
Run Code Online (Sandbox Code Playgroud)