当我尝试使用DomDocument将UTF-8字符串写入XML文件时,它实际上写入字符串的十六进制表示法而不是字符串本身.
例如:
__CODE__
而不是:ירושלים
任何想法如何解决这个问题?
如何<body>使用正则表达式获取标记内的整个内容?
例如,
<html><body><p><a href="#">xx</a></p>
<p><a href="#">xx</a></p></body></html>
Run Code Online (Sandbox Code Playgroud)
我想要归还这个,
<p><a href="#">xx</a></p>
<p><a href="#">xx</a></p>
Run Code Online (Sandbox Code Playgroud)
还是其他更好的想法?也许DOM,但我必须使用saveHTML();它然后它将返回doctype并body标记...
HTML Purifier很难用,所以我决定不使用它.我认为正则表达式可能是我灾难的下一个最佳选择.