如何使用简单的html dom解析器从scrape中抓取特定数据

Question

如何使用简单的html dom解析器从scrape中抓取特定数据

我试图从网页上抓取数据,但我需要获取此链接中的所有数据.

include 'simple_html_dom.php';
$html1 = file_get_html('http://www.aktive-buergerschaft.de/buergerstiftungen/unsere_leistungen/buergerstiftungsfinder');

$info1 = $html1->find('b[class=[what to enter herer ]',0);

Run Code Online (Sandbox Code Playgroud)

我需要从这个网站获取所有数据.

Bürgerstiftung Lebensraum Aachen
    rechtsfähige Stiftung des bürgerlichen Rechts
    Ansprechpartner: Hubert Schramm
    Alexanderstr. 69/ 71
    52062 Aachen
    Telefon: 0241 - 4500130
    Telefax: 0241 - 4500131
    Email: info@buergerstiftung-aachen.de
    www.buergerstiftung-aachen.de
    >> Weitere Details zu dieser Stiftung

Bürgerstiftung Achim
    rechtsfähige Stiftung des bürgerlichen Rechts
    Ansprechpartner: Helga Kühn
    Rotkehlchenstr. 72
    28832 Achim
    Telefon: 04202-84981
    Telefax: 04202-955210
    Email: info@buergerstiftung-achim.de
    www.buergerstiftung-achim.de
    >> Weitere Details zu dieser Stiftung

Run Code Online (Sandbox Code Playgroud)

我需要拥有链接"后面"的数据 - 有没有办法用一个易于理解的解析器来做到这一点 - 一个可以被新手理解和编写的解析器!

Answer 1

Sal*_*bas 7

你提供的链接已关闭,我建议你使用原生的PHP" DOM "扩展而不是"简单的html解析器",它会更快更容易;)我看了一下使用googlecache的页面,你可以使用一些东西喜欢:-

$doc = new DOMDocument;
@$doc->loadHTMLFile('...URL....'); // Using the @ operator to hide parse errors
$contents = $doc->getElementById('content')->nodeValue; // Text contents of #content

Run Code Online (Sandbox Code Playgroud)

Answer 2

Fel*_*ing 2

文档中似乎写着：

$html1->find('b[class=info]',0)->innertext;

Run Code Online (Sandbox Code Playgroud)

归档时间：	14 年，9 月前
查看次数：	2438 次
最近记录：	14 年，9 月前