使用.NET根据模式验证XML

Chr*_*isW 10 .net xml xsd xml-validation

我想测试(true或false)任意XML文件是否与给定模式匹配.

对于它的价值,架构是Word 2003 WordML架构,Microsoft使用大约7个*.xsd文件的列表定义.

其中一个文件还包括W3C xml.xsd文件,包括以下语句:

<xsd:import id="xml" namespace="http://www.w3.org/XML/1998/namespace"
    schemaLocation="http://www.w3.org/2001/xml.xsd"></xsd:import>
Run Code Online (Sandbox Code Playgroud)

我使用如下的.NET代码进行验证:

   public static void validate(string filename)
    {
       XmlReaderSettings settings = new XmlReaderSettings();
       settings.Schemas.Add(
           "http://schemas.microsoft.com/office/word/2003/wordml",
           //to get this file I downloaded "Office 2003: XML Reference Schemas", i.e. "Office2003XMLSchema.exe" 
           @"C:\Program Files\Microsoft Office 2003 Developer Resources\Microsoft Office 2003 XML Reference Schemas\WordprocessingML Schemas\wordnet.xsd"
           );
        settings.ValidationType = ValidationType.Schema;
        settings.ValidationEventHandler += new ValidationEventHandler(validationEventHandler);
        XmlReader xmlReader = XmlReader.Create(filename, settings);
        while (xmlReader.Read()) { }
   }
Run Code Online (Sandbox Code Playgroud)

我的问题是,如果我在未连接到互联网的机器上运行此代码,那么我会收到一个XmlSchemaValidationException无法找到的错误xml.xsd.

为了解决这个问题,我下载了一份xml.xsd,并使用该settings.Schemas.Add方法显式添加:当机器未连接到互联网时,验证现在可以正常工作.

但是,当机器连接到互联网时,我现在得到一个错误说The global attribute 'http://www.w3.org/XML/1998/namespace:lang' has already been declared..

所以显然我需要明确地添加它,或者我不需要,这取决于机器是否能够从互联网上静默下载(或者甚至可能以前能够下载它,并将其缓存到某处).

所以,如果我这样做,那就该死,如果我不这样做,该死的话.我是否需要以一种方式尝试,捕获异常,然后以其他方式尝试?还是有更优雅的解决方案?

lav*_*nio 4

我们看不到您的代码,但在许多实现中,这是通过使用目录解析器将对 .xsd 的请求重定向到本地副本来处理的。有一个属性XmlReaderSettings.XmlResolver可用于此目的。请参阅XMLCatalog.net了解您可以使用的 Apache 许可的实现。

这样做的一个副作用是您可以在本地缓存所有模式。这一点尤其重要,因为 W3C 将阻止对其站点的过度读取,并且您的代码(或更糟糕的是,您客户的代码)将随机开始失败。

  • @ChrisW:我还收到错误“全局属性'http://www.w3.org/XML/1998/namespace:lang'已被声明。”,其代码与您原来的问题类似。您是否将 settings.Schemas.XmlResolver 设置为 XMLCatalogResolver 或其他内容?我尝试过但没有运气。您有机会粘贴您的工作代码吗? (2认同)