以下是我从sitemap.xml获取的示例自定义标记
<url>
<loc>http://sitename.com/programming/php/?C=D;O=A</loc>
<changefreq>weekly</changefreq>
<priority>0.64</priority>
</url>
Run Code Online (Sandbox Code Playgroud)
有很多像这样的条目,如果你看到loc标签,它有c = d; 0 = a在最后.我想删除所有以<url>
结尾开头的条目,</url>
其中包含C = D; 0 = A或类似的模式.
以下表达式与上面指定的整个标记匹配
<url>(.|\r\n)*?<\/url>
Run Code Online (Sandbox Code Playgroud)
但我希望像上面声明中指定的那样匹配.
我们如何形成正则表达式来匹配这些条件(模式)?
mor*_*rja 11
试试这个:
/<url>(?:(?!<\/url>).)*C=D;O=A.*?<\/url>/m
Run Code Online (Sandbox Code Playgroud)
负向前瞻保证您不匹配多个节点.
见这里:rubular