如何使用 Ruby 和 REXML 获取 XML 页面的子节点

Red*_*son 2 ruby xml xpath ruby-on-rails rexml

我使用的是 Ruby 版本 1.9.3。这是我想要从中获取信息的实际 XML 页面的简单版本。我需要从需要登录凭据的安全网站访问它。我无法使用 Nokogiri,因为我无法使用它登录网站。

<root>
  <person>
    <name>Jack</name>
    <age>10</age>
  </person>
  <person>
    <name>Jones</name>
  </person>
  <person>
    <name>Jon</name>
    <age>16</age>
  </person>
</root>
Run Code Online (Sandbox Code Playgroud)

正如您所看到的,有时该标签age不会出现。将 REXML 与 Ruby 结合使用,我使用以下代码:

agent = Mechanize.new
xml = agent.get("https://securewebsite.com/page.xml")
document = REXML::Document.new(xml.body)

name = XPath.match(document, "//person/name").map {|x| x.text} 
# => ["Jack", "Jones", "Jon"]

age =  XPath.match(document, "//person/age").map {|x| x.text} 
# => ["10", "16"]
Run Code Online (Sandbox Code Playgroud)

问题是我无法将age与正确的关联起来name,因为索引现在乱序了。例如,在索引 1 处,name[1] 是 Jones,但age[1] 是 16。但这不是真的,因为personJones 的标签没有年龄标签。

有什么方法可以让数组age输出:# => ["10", nil ,"16"]以便我可以将正确的名字与其相应的年龄相关联?

或者,还有更好的方法?如果需要进一步解释,请告诉我。

Ale*_*sen 5

问题是我们将年龄和姓名视为完全独立的信息集合。我们需要做的是从人那里获取信息作为集合。

xml = "<your xml here />"
doc = Nokogiri::XML(xml)
persons = doc.xpath("//person")
persons_data = persons.map {|person| 
  {
    name: person.xpath("./name").text,
    age: person.xpath("./age").text
  }
}
Run Code Online (Sandbox Code Playgroud)

这会获取人员节点,然后从中获取相关信息,给出结果:

puts persons_data.inspect #=> [
                                {:name=>"Jack", :age=>"10"}, 
                                {:name=>"Jones", :age=>""}, 
                                {:name=>"Jon", :age=>"16"}
                              ]
Run Code Online (Sandbox Code Playgroud)

因此要获取您要拨打的第一个人的姓名和年龄

persons_data[0]["name"] #=> "Jack"
persons_data[0]["age"]  #=> "10"
Run Code Online (Sandbox Code Playgroud)