具有同步和顺序替换的sed

dho*_*kas 8 string bash awk sed

我不确定这是否可以在sed(或awk或任何bash工具)中执行我想要的操作:

我想创建一个脚本替换: )字符串by <happy>) :by <sad>.这可以通过sed轻松完成:

echo "test : )" | sed 's/: )/<happy>/g'
echo "test ) :" | sed 's/) :/<sad>/g'
Run Code Online (Sandbox Code Playgroud)

不幸的是,有时我会有这样的字符串:

I'm happy : ) : ) : )
I'm sad ) : ) : ) :
Run Code Online (Sandbox Code Playgroud)

在这种情况下,输出应该是:

I'm happy <happy> <happy> <happy>
I'm sad <sad> <sad> <sad>
Run Code Online (Sandbox Code Playgroud)

但通过结合上面的两个命令:

echo "I'm happy : ) : ) : )" | sed 's/: )/<happy>/g' | sed 's/) :/<sad>/g'
echo "I'm sad ) : ) : ) :" | sed 's/: )/<happy>/g' | sed 's/) :/<sad>/g'
Run Code Online (Sandbox Code Playgroud)

我会得到:

I'm happy <happy> <happy> <happy>
I'm sad ) <happy> <happy> :
Run Code Online (Sandbox Code Playgroud)

解决这个问题的方法是通过从左到右处理字符串来并行地进行两个替换.我尝试使用这样的东西:sed 's/a/b/g;s/c/d/g'但是替换只是一个接一个地完成,并没有解决问题.

Ed *_*ton 5

使用GNU awk为第3个arg匹配():

$ cat script1.awk
BEGIN {
    map[": )"] = "<happy>"
    map[") :"] = "<sad>"
}
{
    while ( match($0,/(.*)(: \)|\) :)(.*)/,a) ) {
        $0 = a[1] map[a[2]] a[3]
    }
    print
}

$ awk -f script1.awk file
I'm happy <happy> <happy> <happy>
I'm sad <sad> <sad> <sad>
Run Code Online (Sandbox Code Playgroud)

有任何awk:

$ cat script2.awk
BEGIN {
    map[": )"] = "<happy>"
    map[") :"] = "<sad>"
}
{
    while ( match($0,/: \)|\) :/) ) {
        $0 = substr($0,1,RSTART-1) map[substr($0,RSTART,RLENGTH)] substr($0,RSTART+RLENGTH)
    }
    print
}

$ awk -f script2.awk file
I'm happy <happy> <happy> <happy>
I'm sad <sad> <sad> <sad>
Run Code Online (Sandbox Code Playgroud)

虽然在这种情况下两种方法都产生相同的输出,但第一种方法实际上是从字符串的末尾到前导的礼貌,.*而第二种方法从前到后工作.您可以通过此测试看到:

$ echo ': ) :' | awk -f script1.awk
: <sad>

$ echo ': ) :' | awk -f script2.awk
<happy> :
Run Code Online (Sandbox Code Playgroud)

你可以用任何带有调整功能的awk做一个从前到后的传递,但我不认为这是你真正想要的.


编辑以从地图构建正则表达式:

$ cat tst.awk
BEGIN {
    map[": )"] = "<happy>"
    map[") :"] = "<sad>"
    for (emoji in map) {
        gsub(/[^^]/,"[&]",emoji)
        gsub(/\^/,"\\^",emoji)
        emojis = (emojis == "" ? "" : emojis "|") emoji
    }
}
{
    while ( match($0,emojis) ) {
        $0 = substr($0,1,RSTART-1) map[substr($0,RSTART,RLENGTH)] substr($0,RSTART+RLENGTH)
    }
    print
}

$ awk -f tst.awk file
I'm happy <happy> <happy> <happy>
I'm sad <sad> <sad> <sad>
Run Code Online (Sandbox Code Playgroud)

  • 当然,我刚刚添加了一个版本. (2认同)