我正在遵循这个脚本并尝试了解每一行发生的情况。从此处提取的以下行涉及对一些字段进行排序。在这里给出的第 14 个示例中,它表示-k2,5代表对作为数值的列 2 和 5 进行排序,并-k9代表对作为非数字值列的第 9 列进行排序。
# Process the STMs
cat db/TEDLIUM_release1/$set/stm/*.stm | sort -k1,1 -k2,2 -k4,4n | \
sed -e 's:<F0_M>:<o,f0,male>:' \
-e 's:<F0_F>:<o,f0,female>:' \
-e 's:([0-9])::g' \
-e 's:<sil>::g' \
-e 's:([^ ]*)$::' | \
awk '{ $2 = "A"; print $0; }'
} | local/join_suffix.py db/TEDLIUM_release1/TEDLIUM.150K.dic > data/$set/stm
Run Code Online (Sandbox Code Playgroud)
但在上面的代码段(sort -k1,1 -k2,2 -k4,4n)中,它映射-k1,1并且也有 3 组。有人可以帮助我理解这一点吗?
sort ×1