我试图在某个网页的正文中阅读以显示在一个单独的网页上,但我遇到了一些麻烦.现在,我使用以下代码
<?php
@$doc = new DOMDocument();
@$doc->loadHTMLFile('http://foo.com');
@$tags = $doc->getElementsByTagName('body');
foreach ($tags as $tag) {
$index_text .= $tag->nodeValue;
print nl2br($tag->nodeValue).'<br />';
}
?>
Run Code Online (Sandbox Code Playgroud)
这段代码有效,但它似乎删除了很多格式,这对我来说很重要,比如换行符.我如何阻止这种情况发生
formatOutputDOMDocument 的属性将执行此操作.
$doc->formatOutput = true;
Run Code Online (Sandbox Code Playgroud)
这将导致DOM输出更多地输出供人类消费,在你需要它们的时候换行和缩进,即'漂亮打印'.
此值的默认值为false,因此您必须true在需要时将其显式设置为.