转义字符串以获取sed替换模式

Ale*_*ysh 296 string escaping sed

在我的bash脚本中,我有一个外部(从用户接收)字符串,我应该在sed模式中使用它.

REPLACE="<funny characters here>"
sed "s/KEYWORD/$REPLACE/g"
Run Code Online (Sandbox Code Playgroud)

如何逃避$REPLACE字符串,以便sed作为文字替代品安全地接受?

注意:KEYWORD是一个没有匹配等的哑子串.它不是由用户提供的.

Pia*_*rus 248

警告:这并没有考虑换行.有关更深入的答案,请参阅此SO问题.(谢谢,Ed Morton和Niklas Peter)

请注意,逃避一切都是一个坏主意.Sed需要转义许多字符以获得它们的特殊含义.例如,如果您转义替换字符串中的数字,它将转入反向引用.

正如Ben Blank所说,在替换字符串中只需要转义三个字符(转义自身,正斜杠表示结束语句和&替换全部):

sed -e 's/[\/&]/\\&/g'
Run Code Online (Sandbox Code Playgroud)

如果您需要转义KEYWORD字符串,则需要以下内容:

sed -e 's/[]\/$*.^[]/\\&/g'
Run Code Online (Sandbox Code Playgroud)

请记住,如果您使用的字符不是/分隔符,则需要使用您正在使用的字符替换上面表达式中的斜杠.请参阅PeterJCLaw的评论以获得解释.

编辑:由于以前没有考虑到一些角落情况,上面的命令已经改变了好几次.检查编辑历史记录以获取详细信

  • 值得注意的是,你可以避免因不使用它们作为分隔符而逃避正斜杠.大多数(所有?)版本的sed允许你使用任何字符,只要它符合模式:$ echo'foo/bar'| sed s _/_:_#foo:bar (16认同)
  • +1,我没有想到backrefs和东西. (11认同)
  • sed -e's/\(\ /\| \\\ |&\)/ \\&/ g'在OSX上对我不起作用,但这样做:sed's/\([\\\ /& ] \)/ \\&/ g',它稍短. (2认同)

scr*_*www 85

sed命令允许您使用其他字符而不是/分隔符:

sed 's#"http://www\.fubar\.com"#URL_FUBAR#g'
Run Code Online (Sandbox Code Playgroud)

双引号不是问题.

  • 你仍然需要逃避`.`,否则它具有特殊意义.我编辑了你的答案. (5认同)
  • 它改变了我的生活!谢谢你! (2认同)

Ben*_*ank 44

在replace子句中专门处理的唯一三个文字字符是/(关闭子句),\(转义字符,反向引用和&c.),以及&(在替换中包括匹配).因此,您需要做的就是逃避这三个字符:

sed "s/KEYWORD/$(echo $REPLACE | sed -e 's/\\/\\\\/g; s/\//\\\//g; s/&/\\\&/g')/g"
Run Code Online (Sandbox Code Playgroud)

例:

$ export REPLACE="'\"|\\/><&!"
$ echo fooKEYWORDbar | sed "s/KEYWORD/$(echo $REPLACE | sed -e 's/\\/\\\\/g; s/\//\\\//g; s/&/\\\&/g')/g"
foo'"|\/><&!bar
Run Code Online (Sandbox Code Playgroud)

  • 我认为也是换行符。如何转义换行符? (2认同)
  • 请注意echo的默认行为与反斜杠有关.在bash中,echo默认不解释反斜杠转义,这在此处起作用.另一方面,在dash(sh)中,echo解释反斜杠转义,据我所知,没有办法抑制这种情况.因此,在dash(sh)中,而不是echo $ x,执行printf'%s \n'$ x. (2认同)
  • @Drux这三个字符是*replace*子句中唯一的特殊字符.模式条款中有更多特别之处. (2认同)

Gur*_*ngh 33

基于Pianosaurus的正则表达式,我创建了一个bash函数,它可以逃避关键字和替换.

function sedeasy {
  sed -i "s/$(echo $1 | sed -e 's/\([[\/.*]\|\]\)/\\&/g')/$(echo $2 | sed -e 's/[\/&]/\\&/g')/g" $3
}
Run Code Online (Sandbox Code Playgroud)

以下是您使用它的方式:

sedeasy "include /etc/nginx/conf.d/*" "include /apps/*/conf/nginx.conf" /etc/nginx/nginx.conf
Run Code Online (Sandbox Code Playgroud)

  • 是否有一个函数只是为了转义 sed 的字符串而不是环绕 sed ? (3认同)
  • 谢谢!如果其他人在尝试使用它时遇到语法错误,就像我一样,只记得使用bash运行它,而不是sh (2认同)

use*_*464 16

回复有点迟了......但有一种更简单的方法可以做到这一点.只需更改分隔符(即分隔字段的字符).所以,而不是s/foo/bar/你写s|bar|foo.

而且,这是简单的方法:

sed 's|/\*!50017 DEFINER=`snafu`@`localhost`\*/||g'
Run Code Online (Sandbox Code Playgroud)

结果输出没有那个令人讨厌的DEFINER子句.

  • 不,"&"和"\`必须仍然被转义,分隔符也必须被选中. (10认同)
  • 这解决了我的问题,因为我在替换字符串中有"/"字符.谢啦! (3认同)

des*_*son 11

原来你问的是错误的问题.我也问了一个错误的问题.它错误的原因是第一句话的开头:"在我的bash脚本中......".

我有同样的问题并犯了同样的错误.如果你正在使用bash,你不需要使用sed来进行字符串替换(并且使用bash中内置的替换功能更加清晰).

而不是像,例如:

function escape-all-funny-characters() { UNKNOWN_CODE_THAT_ANSWERS_THE_QUESTION_YOU_ASKED; }
INPUT='some long string with KEYWORD that need replacing KEYWORD.'
A="$(escape-all-funny-characters 'KEYWORD')"
B="$(escape-all-funny-characters '<funny characters here>')"
OUTPUT="$(sed "s/$A/$B/g" <<<"$INPUT")"
Run Code Online (Sandbox Code Playgroud)

你可以专门使用bash功能:

INPUT='some long string with KEYWORD that need replacing KEYWORD.'
A='KEYWORD'
B='<funny characters here>'
OUTPUT="${INPUT//"$A"/"$B"}"
Run Code Online (Sandbox Code Playgroud)

  • 如果您需要对文件使用 sed 怎么办? (3认同)
  • 您实际上不必引用赋值的右侧(除非您想做类似 `var='has space'` 的操作) – `OUTPUT=${INPUT//"$A"/"$B “}`是安全的。 (2认同)