重复正则表达式替换为SED

nev*_*int 5 regex linux sed

我有以下几行(实际上这些行中约有1M条):

foo|||bar
qux||boo|fzx
Run Code Online (Sandbox Code Playgroud)

请注意,每行包含4个字段,但字符数可以超过3个.

我想做的是|||nil|结果替换每一个:

foo|nil|nil|bar
qux|nil|boo|fzx
Run Code Online (Sandbox Code Playgroud)

用sed做的方法是什么?

我试过这个却失败了:

sed 's/||/|nil/g'
Run Code Online (Sandbox Code Playgroud)

Tho*_*hor 16

您需要重复替换,直到它不会改变:

sed ':a; s/||/|nil|/g; ta'
Run Code Online (Sandbox Code Playgroud)

但是,这不会处理开头或结尾的空字段,因为您需要另外两个模式:

sed 's/^|/nil|/; s/|$/|nil/; :a; s/||/|nil|/g; ta'
Run Code Online (Sandbox Code Playgroud)

测试

输入:

cat << EOF > infile
foo|||bar
qux||boo|fzx
|||
EOF
Run Code Online (Sandbox Code Playgroud)

运行:

<infile sed 's/^|/nil|/; s/|$/|nil/; :a; s/||/|nil|/g; ta'
Run Code Online (Sandbox Code Playgroud)

输出:

foo|nil|nil|bar
qux|nil|boo|fzx
nil|nil|nil|nil
Run Code Online (Sandbox Code Playgroud)

一个awk的方式

awk '{ for(i=1;i<=NF;i++) if(length($i)==0) $i="nil" } 1' FS='|' OFS='|'
Run Code Online (Sandbox Code Playgroud)