用于匹配&不是HTML实体的正则表达式(在PHP中)

Dou*_*aye 4 php regex pcre

这是我们的目标:用&更换所有独立的&符号.但不能替换那些已经属于HTML实体的人,例如 .

我想我需要一个PHP的正则表达式(最好是preg_函数),它只匹配独立的&符号.我只是不知道如何用preg_replace做到这一点.

Kor*_*nel 8

PHP htmlentities()double_encode这个论点.

如果你想在正则表达式中做类似的事情,那么负面断言就会变得有用:

preg_replace('/&(?![a-z#]+;)/i','&',$txt);
Run Code Online (Sandbox Code Playgroud)

  • +1!但要彻底,regexp应该是:&(?!([a-zA-Z] + |#[0-9] + | #x [0-9a-fA-F] +);) (6认同)
  • `&((:[A-ZA-Z] [A-ZA-Z\d]*|#(?:!?\ d + | [XX] [A-FA-F\d] +))) `将确保它捕获像`½`这样的实体.您可以使用较短的`&(?!(?:[az] [az\d]*|#(?:\ d + | [xX] [af\d] +));)`如果你有`i `标志集. (3认同)

Ros*_*oss 7

你可以在跑步html_entity_decode前一直跑htmlentities?除非您只想做&符号(即使这样你可以使用charset参数),也可以工作.

比正则表达式更容易和更快.