我们如何创建这样的正则表达式来提取数据?

bob*_*obo 0 regex string

<br>Aggie<br><br>John<br><p>Hello world</p><br>Mary<br><br><b>Peter</b><br>
Run Code Online (Sandbox Code Playgroud)

我想创建一个安全匹配这些的正则表达式:

<br>Aggie<br>
<br>John<br>
<br>Mary<br>
<br><b>Peter</b><br>
Run Code Online (Sandbox Code Playgroud)

这是可能的,还有其他标签(例如<i>,<strike>每对之间...等)<br>,他们必须收集就像<br><b>Peter</b><br>

正则表达式应该如何?

RC.*_*RC. 6

如果您在SO上学到一件事,那就让它 - "不要用正则表达式解析HTML".使用HTML解析器

  • 这个问题缺少强制性的bobince参考:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 (2认同)