sou*_*rge 7 php dom xml-namespaces
我使用DOM扩展来解析包含xml命名空间的xml文件.我原以为命名空间声明就像任何其他属性一样对待,但我的测试似乎不同意.我有一个像这样开头的文档:
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns="http://purl.org/rss/1.0/"
xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:syn="http://purl.org/rss/1.0/modules/syndication/"
xmlns:prism="http://purl.org/rss/1.0/modules/prism/"
xmlns:admin="http://webns.net/mvcb/"
>
Run Code Online (Sandbox Code Playgroud)
和这样的测试代码:
$doc = new DOMDocument();
$doc->loadXml(file_get_contents('/home/soulmerge/tmp/rss1.0/recent.xml'));
$root = $doc->documentElement;
var_dump($root->tagName);
# prints 'string(7) "rdf:RDF"'
var_dump($root->attributes->item(0));
# prints 'NULL'
var_dump($root->getAttributeNode('xmlns'));
# prints 'object(DOMNameSpaceNode)#3 (0) {}'
Run Code Online (Sandbox Code Playgroud)
所以问题是:
DOMNameSpaceNode?一对php.net搜索不会产生任何有用的结果.Vol*_*erK 11
除非有更直接的方法,否则可以使用XPath及其命名空间轴.
例如
<?php
$doc = new DOMDocument;
$doc->loadxml('<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns="http://purl.org/rss/1.0/"
xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:syn="http://purl.org/rss/1.0/modules/syndication/"
xmlns:prism="http://purl.org/rss/1.0/modules/prism/"
xmlns:admin="http://webns.net/mvcb/"
>
...
</rdf:RDF>');
$context = $doc->documentElement;
$xpath = new DOMXPath($doc);
foreach( $xpath->query('namespace::*', $context) as $node ) {
echo $node->nodeValue, "\n";
}
Run Code Online (Sandbox Code Playgroud)
版画
http://www.w3.org/XML/1998/namespace
http://webns.net/mvcb/
http://purl.org/rss/1.0/modules/prism/
http://purl.org/rss/1.0/modules/syndication/
http://purl.org/dc/elements/1.1/
http://purl.org/rss/1.0/modules/taxonomy/
http://purl.org/rss/1.0/
http://www.w3.org/1999/02/22-rdf-syntax-ns#
Run Code Online (Sandbox Code Playgroud)
编辑和顺便说一句:我还没有找到DOMNameSpaceNode的文档.但你可以从ext/dom/php_dom.c中的源代码中"删除"(部分)其功能.
它似乎没有暴露任何方法并暴露属性
"nodeName", "nodeValue", "nodeType",
"prefix", "localName", "namespaceURI",
"ownerDocument", "parentNode"
Run Code Online (Sandbox Code Playgroud)
全部由与相应DOMNode属性相同的函数处理.
注意
echo $root->getAttributeNode('xmlns')->nodeValue . "\n";
echo $root->getAttribute('xmlns') . "\n";
echo $root->getAttribute('xmlns:syn') . "\n";
Run Code Online (Sandbox Code Playgroud)
一切都按预期工作,并打印出来
http://purl.org/rss/1.0/
http://purl.org/rss/1.0/
http://purl.org/rss/1.0/modules/syndication/
Run Code Online (Sandbox Code Playgroud)
因为 DOMNameSpaceNode 是一个节点,而不是一个 NodeCollection。
只是澄清一下,除非 PHP DOM 扩展中的某些内容发生更改,否则 XPath(如 VolkerK 所解释的)是获取所有名称空间的唯一本机方式,而不管文档如何。