我正在尝试为“肯德基”等页面提取母公司信息(在信息框窗格中)。
如果您访问
url...信息框包含属性(Parent = Yum!Brands)
.. 但是,当我通过 PHP API 访问时.. 不包括父信息。
我如何确保 Wikipedia API 也返回“Parent =”信息(对于像“KFC”这样的品牌术语)。本质上,我想通过维基百科 API 提取 Yum Brands 是肯德基的母公司的信息。
谢谢!
看看维基百科维基官方获取信息的方式。
我的建议是通过PHP Simple HTML DOM Parser使用屏幕抓取,这将始终是最好的,即使它已被弃用。唯一的缺点是,如果维基百科改变了它的样子,你将不得不更新你的代码。
一个引导到PHP简单的HTML DOM解析器。
编辑:
至少我正在做一些事情,而不是链接到非工作资源并拒绝正确的答案......
这是我使用 PHP Simple HTML DOM Parser 从 Infobox 窗格中获取母公司信息的代码。
<?php
//The folder where you uploaded simple_html_dom.php
require_once('/homepages/../htdocs/simple_html_dom.php');
//Wikipedia page to parse
$html = file_get_html('http://en.wikipedia.org/wiki/KFC');
foreach ( $html->find ( 'tr th a[title=Holding company]' ) as $element ) {
$element = $element->parent;
$element = $element->parent;
$tabella = $element->find ( 'td', 0 );
//Now $parent contains "Yum! Brands"
$parent = $tabella->plaintext;
echo $parent;
}
?>
Run Code Online (Sandbox Code Playgroud)
如果此答案适合您的需求,请将其选为最佳答案并点赞,因为我花了很多精力,大约 1 小时 =/
谢谢 ;)
| 归档时间: |
|
| 查看次数: |
2971 次 |
| 最近记录: |