如何使用正则表达式获取`<body>`标签内的全部内容?

lau*_*kok 11 php regex html-parsing

如何<body>使用正则表达式获取标记内的整个内容?

例如,

<html><body><p><a href="#">xx</a></p>

<p><a href="#">xx</a></p></body></html> 
Run Code Online (Sandbox Code Playgroud)

我想要归还这个,

<p><a href="#">xx</a></p>

<p><a href="#">xx</a></p>
Run Code Online (Sandbox Code Playgroud)

还是其他更好的想法?也许DOM,但我必须使用saveHTML();它然后它将返回doctypebody标记...

HTML Purifier很难用,所以我决定不使用它.我认为正则表达式可能是我灾难的下一个最佳选择.

Fla*_*ino 23

preg_match("/<body[^>]*>(.*?)<\/body>/is", $html, $matches);
Run Code Online (Sandbox Code Playgroud)

$matches[1] 将是body标签的内容