如何使用 Nokogiri 验证 XML?

Ahm*_*mza 2 ruby xml ruby-on-rails nokogiri xml-parsing

我必须验证 XML 文档,以便它不会接受无效的 XML 文档。

我这样做是为了处理无效文档:

xml ||= Nokogiri::XML xml_data do |config| 
  config.strict
end
rescue Nokogiri::XML::SyntaxError => e
  puts "caught exception: #{e}"
else
  #further processing if no error
Run Code Online (Sandbox Code Playgroud)

但即使对于有效的 XML 文档,它也显示:

caught exception: Extra content at the end of the document
Run Code Online (Sandbox Code Playgroud)

我正在使用的示例 XML:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE note SYSTEM "Note.dtd">
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
Run Code Online (Sandbox Code Playgroud)

我究竟做错了什么?

the*_*Man 10

如果你想查看一个文档是否是无效的XML,只需检查errors返回文档的方法:

require 'nokogiri'

doc = Nokogiri::XML('<xml><foo></xml>')
doc.errors
# => [#<Nokogiri::XML::SyntaxError: Opening and ending tag mismatch: foo line 1 and xml>,
#     #<Nokogiri::XML::SyntaxError: Premature end of data in tag xml line 1>]
Run Code Online (Sandbox Code Playgroud)

如果 Nokogiri 发现任何错误,它将填充该errors数组。