来自<p>标签的文本使用DOM Php

Question

来自<p>标签的文本使用DOM Php

嘿,考虑我有以下的html语法

<p>xyz</p>
<p>abc</p>

Run Code Online (Sandbox Code Playgroud)

我想使用DOM检索文本(xyz和abc).

这是我的代码.

<?php
$link='http://www.xyz.com';
$ret= getLinks($link);
print_r ($ret);

function getLinks($link)
{
    /*** return array ***/
    $ret = array();

    /*** a new dom object ***/
    $dom = new domDocument;

    /*** get the HTML (suppress errors) ***/
    @$dom->loadHTML(file_get_contents($link));

    /*** remove silly white space ***/
    $dom->preserveWhiteSpace = false;

    /*** get the links from the HTML ***/
    $text = $dom->getElementsByTagName('p');

/*** loop over the links ***/
    foreach ($text as $tag)
    {
        $ret[] = $tag->innerHTML;
    }

    return $ret;
}
?>

Run Code Online (Sandbox Code Playgroud)

但我得到一个空洞的结果.我在这里呀呀.

Answer 1

Gor*_*don 8

要禁止解析错误,请不要使用

@$dom->loadHTML(file_get_contents($link));

Run Code Online (Sandbox Code Playgroud)

但

libxml_use_internal_errors(TRUE);

Run Code Online (Sandbox Code Playgroud)

此外,没有理由使用file_get_contents.DOM可以从远程资源加载.

libxml_use_internal_errors(TRUE);
$dom->loadHTMLFile($link);
libxml_clear_errors();

Run Code Online (Sandbox Code Playgroud)

此外,标记名称区分大小写.您正在查询<P>代码段何时包含<p>.改成

$text = $dom->getElementsByTagName('p');

Run Code Online (Sandbox Code Playgroud)

最后,没有innerHTML.用于获取它的用户态解决方案是

如何获得DOMNode的innerHTML？

您可以获取outerHTML与

$ret[] = $dom->saveHtml($tag); // requires PHP 5.3.6+

Run Code Online (Sandbox Code Playgroud)

要么

$ret[] = $dom->saveXml($tag); // that will make it XML compliant though

Run Code Online (Sandbox Code Playgroud)

要获取P标记的文本内容,请使用

$ret[] = $tag->nodeValue;

Run Code Online (Sandbox Code Playgroud)

归档时间：	15 年前
查看次数：	6897 次
最近记录：	14 年，1 月前