Eve*_*r69 7 unix bash shell awk dataframe
我的数据框看起来像这样:
ERR843978.19884 13 51 51
ERR843978.2880 10 49 51
ERR843978.10002 7 48 55
ERR843978.1158 8 45 54
ERR843978.4671 14 62 60
ERR843978.83 15 56 70
ERR843978.9406 8 56 39
ERR843978.8383 12 59 43
ERR843978.8916 6 51 42
Run Code Online (Sandbox Code Playgroud)
我希望为所有行做到这一点:
column2/(column3*column4)
Run Code Online (Sandbox Code Playgroud)
然后在新文件中打印输出.
我写了一个bash脚本来做它,但它有点慢,所以我正在寻找一个更有效的解决方案(也许与awk?).
这是我的代码
while read line
do
out0=$(awk '{print $1}' <<< $line)
out1=$(awk '{print $2}' <<< $line)
out2=$(awk '{print $3}' <<< $line)
out3=$(awk '{print $4}' <<< $line)
out4=`echo "scale=5; ($out1 / ($out2 * $out3))"|bc -l`
echo "$out0;$out4"
done < $file
Run Code Online (Sandbox Code Playgroud)
是的,awk这里效率很高:
awk '{ print $2/($3 * $4) }' file > newfile
Run Code Online (Sandbox Code Playgroud)