如何从网页上获取内容？

Question

如何从网页上获取内容？

我想从网页中获取div内容并在我的页面中使用它.

我有网址http://www.freebase.com/search?limit=30&start=0&query=cancer
我想获取id为artilce-1001的div内容.我怎么能在php或jQuery中做到这一点？

Answer 1

如果您想使用PHP,您可能需要查看Simple HTML DOM.这是一个很好的单一包含文件.的文档给刮Slashdot的作为示例:

$html = file_get_html('http://slashdot.org/');

// Find all article blocks
foreach($html->find('div.article') as $article) {
    $item['title']     = $article->find('div.title', 0)->plaintext;
    $item['intro']    = $article->find('div.intro', 0)->plaintext;
    $item['details'] = $article->find('div.details', 0)->plaintext;
    $articles[] = $item;
}

Run Code Online (Sandbox Code Playgroud)

正则表达式从不擅长(并且永远不应该用于)解析HTML.它不是常规的,你最终会得到巨大的正则表达式,用于简单的jQuery或上面的库

编辑:
所以你想要使用类似的东西

$html = file_get_html('http://www.freebase.com/search?limit=30&start=0&query=cancer');
$text = $html->find('div[id=artilce-1001]',0)->plaintext;

Run Code Online (Sandbox Code Playgroud)

归档时间：	16 年，6 月前
查看次数：	4055 次
最近记录：	15 年，12 月前