在div标签之间提取文本 - 简单的Html Dom Parser

Kis*_*hor -2 php parsing dom

代码:

$html = file_get_html('http://url.com');
$ret = $html->find('div[samplediv]');
echo $ret;
Run Code Online (Sandbox Code Playgroud)

我得到的输出只是数组.这意味着它是空的.我确信div是在我正在抓取的页面上预设的.

另外,我想要实现的另一件事是,从html中获取文本.当我简单地将其转换为纯文本时,会导致许多不需要的数字和内容.所以我要做的是,获取我在浏览器中看到的文本.(而不是从HTML获取整个文本).

欢迎所有建议.

Umb*_*lla 8

看起来你正在输出整个文件.尝试

echo $ret->innertext;
Run Code Online (Sandbox Code Playgroud)

只输出div的内容.

PS:我只是在google上看了这个,找到了http://simplehtmldom.sourceforge.net/manual.htm