如何解析 xml 站点地图中的图像标签?

cap*_*pex 2 php xml parsing image

<url>
<loc>
<![CDATA[ https://www.news18.com/photogallery/photogallery/in-photos-five-most-expensive-face-masks-for-protection-from-covid-19-in-the-world-3519821.html ]]>
</loc>
<image:image>
<image:loc>
<![CDATA[ https://images.news18.com/ibnlive/uploads/2021/03/1615377235_mask-1.jpg ]]>
</image:loc>
<image:caption>
<![CDATA[ ]]>
</image:caption>
</image:image>
<image:image>
<image:loc>
<![CDATA[ https://images.news18.com/ibnlive/uploads/2021/03/1615377250_mask-2.jpg ]]>
</image:loc>
<image:caption>
<![CDATA[ ]]>
</image:caption>
</image:image>
</url>
Run Code Online (Sandbox Code Playgroud)

如果我写 $xml->url->image:image | 如何在 php 中选择 image:image 元素 这将是错误的语法

Chr*_*aas 5

首先熟悉XML 命名空间是个好主意。

我假设在更高的层次上你有一些东西可以解释所image:代表的内容。如果不这样做,那就是一个不同的问题,并且可以说您没有 XML,只是看起来很像它的东西。这是完全相同的 XML,但包含在我认为由 Google 定义的图像站点地图中。

$xml = <<<'TAG'
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
<url>
<loc>
<![CDATA[ https://www.news18.com/photogallery/photogallery/in-photos-five-most-expensive-face-masks-for-protection-from-covid-19-in-the-world-3519821.html ]]>
</loc>
<image:image>
<image:loc>
<![CDATA[ https://images.news18.com/ibnlive/uploads/2021/03/1615377235_mask-1.jpg ]]>
</image:loc>
<image:caption>
<![CDATA[ ]]>
</image:caption>
</image:image>
<image:image>
<image:loc>
<![CDATA[ https://images.news18.com/ibnlive/uploads/2021/03/1615377250_mask-2.jpg ]]>
</image:loc>
<image:caption>
<![CDATA[ ]]>
</image:caption>
</image:image>
</url>
</urlset>
TAG;
Run Code Online (Sandbox Code Playgroud)

要通过名称空间访问事物,您可以使用children()适当的名称空间扩展调用节点:

$doc = simplexml_load_string($xml);
echo $doc->url[0]->children('http://www.google.com/schemas/sitemap-image/1.1')->image->loc;
Run Code Online (Sandbox Code Playgroud)

这打印出:


 https://images.news18.com/ibnlive/uploads/2021/03/1615377235_mask-1.jpg

Run Code Online (Sandbox Code Playgroud)