我想从网页中获取div内容并在我的页面中使用它.
我有网址http://www.freebase.com/search?limit=30&start=0&query=cancer
我想获取id为artilce-1001的div内容.我怎么能在php或jQuery中做到这一点?
如果您想使用PHP,您可能需要查看Simple HTML DOM.这是一个很好的单一包含文件.的文档给刮Slashdot的作为示例:
$html = file_get_html('http://slashdot.org/');
// Find all article blocks
foreach($html->find('div.article') as $article) {
$item['title'] = $article->find('div.title', 0)->plaintext;
$item['intro'] = $article->find('div.intro', 0)->plaintext;
$item['details'] = $article->find('div.details', 0)->plaintext;
$articles[] = $item;
}
Run Code Online (Sandbox Code Playgroud)
正则表达式从不擅长(并且永远不应该用于)解析HTML.它不是常规的,你最终会得到巨大的正则表达式,用于简单的jQuery或上面的库
编辑:
所以你想要使用类似的东西
$html = file_get_html('http://www.freebase.com/search?limit=30&start=0&query=cancer');
$text = $html->find('div[id=artilce-1001]',0)->plaintext;
Run Code Online (Sandbox Code Playgroud)