AKW*_*KWF 8 ruby xml nokogiri xml-parsing
在名为"string"的字符串中给出这个XML:
<Guide>
<Master>
<Part>12345</Part>
<Sub>
<Name>A</Name>
</Sub>
<Sub>
<Name>B</Name>
</Sub>
</Master>
<Master>
<Part>XYZABC</Part>
<Sub>
<Name>A</Name>
</Sub>
<Sub>
<Name>C</Name>
</Sub>
</Master>
</Guide>
Run Code Online (Sandbox Code Playgroud)
这行代码:
bgdoc = Nokogiri::XML::DocumentFragment.parse(xstring.to_xml)
Run Code Online (Sandbox Code Playgroud)
我想遍历名为"Part"的所有节点.
我尝试了以下方法:
bgdoc.xpath("//Part").each do |node|
Run Code Online (Sandbox Code Playgroud)
和:
bgdoc.children.each do |node|
next unless node.name=="Part"
Run Code Online (Sandbox Code Playgroud)
但那没用.
问题是将XML解析为片段会返回一个部分XML文档,即a DocumentFragment
,它没有root:
1.9.2-p290 :002 > doc = Nokogiri::XML::DocumentFragment.parse('<a><b>foo</b></a>').root
NoMethodError: undefined method `root' for #<Nokogiri::XML::DocumentFragment:0x00000100b34448>
from (irb):2
from /Users/greg/.rvm/rubies/ruby-1.9.2-p290/bin/irb:16:in `<main>'
Run Code Online (Sandbox Code Playgroud)
而完整的XML文档确实有一个根:
1.9.2-p290 :003 > doc = Nokogiri::XML('<a><b>foo</b></a>').root
=> #<Nokogiri::XML::Element:0x8058b350 name="a" children=[#<Nokogiri::XML::Element:0x80587b10 name="b" children=[#<Nokogiri::XML::Text:0x80587818 "foo">]>]>
Run Code Online (Sandbox Code Playgroud)
默认情况下,Nokogiri将使用XPath从文档的根目录进行搜索//Path
:
1.9.2-p290 :004 > doc = Nokogiri::XML('<a><Path>foo</Path></a>').search('//Path')
=> [#<Nokogiri::XML::Element:0x8055465c name="Path" children=[#<Nokogiri::XML::Text:0x805543c8 "foo">]>]
Run Code Online (Sandbox Code Playgroud)
但由于缺少root,片段失败了:
1.9.2-p290 :005 > doc = Nokogiri::XML::DocumentFragment.parse('<a><Path>foo</Path></a>').search('//Path')
=> []
Run Code Online (Sandbox Code Playgroud)
诀窍是在处理片段时告诉Nokogiri在哪里看.使用相对搜索或通配符:
1.9.2-p290 :006 > doc = Nokogiri::XML::DocumentFragment.parse('<a><Path>foo</Path></a>').search('.//Path')
=> [#<Nokogiri::XML::Element:0x8053c69c name="Path" children=[#<Nokogiri::XML::Text:0x8053c46c "foo">]>]
Run Code Online (Sandbox Code Playgroud)
要么
1.9.2-p290 :007 > doc = Nokogiri::XML::DocumentFragment.parse('<a><Path>foo</Path></a>').search('*//Path')
=> [#<Nokogiri::XML::Element:0x8052a208 name="Path" children=[#<Nokogiri::XML::Text:0x80529fec "foo">]>]
Run Code Online (Sandbox Code Playgroud)