XML Schema:我是否可以使某些属性的值成为必需但仍然允许其他值?

scr*_*tty 8 xml schema xsd

(注意:我无法更改我收到的XML的结构.我只能更改我验证它的方式.)

假设我可以像这样得到XML:

<Address Field="Street" Value="123 Main"/>
<Address Field="StreetPartTwo" Value="Unit B"/>
<Address Field="State" Value="CO"/>
<Address Field="Zip" Value="80020"/>
<Address Field="SomeOtherCrazyValue" Value="Foo"/>
Run Code Online (Sandbox Code Playgroud)

我需要创建一个XSD架构,验证"Street","State"和"Zip" 必须存在.但我不在乎"StreetPartTwo"和/或"SomeOtherCrazyValue"是否恰好存在.

如果我知道只有我关心的三个可以被包括(并且每个只包括一次),我可以做这样的事情:

<xs:element name="Address" type="addressType" maxOccurs="unbounded" minOccurs="3"/>

<xs:complexType name="addressType">
  <xs:attribute name="Field" use="required">
    <xs:simpleType>
      <xs:restriction base="xs:string">
        <xs:enumeration value="Street"/>
        <xs:enumeration value="State"/>
        <xs:enumeration value="Zip"/>
      </xs:restriction>
    </xs:simpleType>
  </xs:attribute>
</xs:complexType>
Run Code Online (Sandbox Code Playgroud)

但是这对我的情况不起作用,因为我也可能会收到那些我不关心的其他Address元素(也有"Field"属性).

任何想法如何我可以确保我关心的东西存在,但也让其他的东西?

TIA!肖恩

Che*_*eso 6

只使用XML Schema,您无法进行所需的验证.

根据"XML Schema Part 1:Structures"规范 ......

当直接或间接包含在模型组的{粒子}中的两个或多个粒子具有与{term}相同的元素声明时,这些声明的类型定义必须相同.

这并不是说您无法构建将验证正确文档的架构.这意味着,您无法构建无法验证某些不正确文档的架构.当我说"不正确"时,我指的是违反您用英语说明的限制的文件.

例如,假设您有一个包含三个Street元素的文档,如下所示:

<Address Field="Street" Value="123 Main"/> 
<Address Field="Street" Value="456 Main"/> 
<Address Field="Street" Value="789 Main"/> 
<Address Field="SomeOtherCrazyValue" Value="Foo"/> 
Run Code Online (Sandbox Code Playgroud)

根据您的架构,该文档是有效的地址.可以在模式中添加xs:unique约束,以便它可以拒绝这些损坏的文档.但即使使用xs:unique,对这样的模式进行验证也会声明其他一些不正确的文档是有效的 - 例如,一个包含三个<Address>元素的文档,每个元素都有一个唯一的Field属性,但都没有Field="Zip".

实际上,不可能生成一个W3C XML Schema,它正式编写了您所声明的约束.该<xs:all>元素几乎让你threre,但它仅适用于元素,而不是属性.并且,它不能与扩展一起使用,因此您不能在W3C XML Schema中说"所有这些元素以任何顺序加上任何其他元素".


为了执行您寻求的验证,您的选择是:

  1. 依赖XML Schema以外的东西,
  2. 在多个步骤中执行验证,第一步使用XML Schema,第二步使用其他东西.

对于第一种选择,我认为你可以使用Relax NG来做到这一点.其缺点是,它不是一个标准,据我所知,它既没有得到广泛支持也没有增长.这就像学习盖尔语来表达思想一样.盖尔语没有任何问题,但它是一种语言的死胡同,我认为RelaxNG也是如此.

对于第二个选项,一种方法是作为第一步验证您的模式,然后,作为第二步:

A.应用XSL转换,该转换将<Address>元素转换为为其Field属性的值命名的元素.该转换的输出如下所示:

<root>
  <Street Value="101 Bellavista Drive"/>
  <State  Value="Confusion"/>
  <Zip    Value="10101"/>
</root>
Run Code Online (Sandbox Code Playgroud)

B.根据不同的模式验证该变换的输出,如下所示:

<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
           elementFormDefault="qualified">
  <xs:element name="root">
    <xs:complexType>
      <xs:all>
        <xs:element maxOccurs="1" minOccurs="1" ref="Street" />
        <xs:element maxOccurs="1" minOccurs="1" ref="State" />
        <xs:element maxOccurs="1" minOccurs="1" ref="Zip" />
      </xs:all>
    </xs:complexType>
  </xs:element>

  <xs:element name="Street">
    <xs:complexType>
      <xs:attribute name="Value" use="required" type="xs:string"/>
    </xs:complexType>
  </xs:element>
  <xs:element name="State">
    <xs:complexType>
      <xs:attribute name="Value" use="required" type="xs:string"/>
    </xs:complexType>
  </xs:element>
  <xs:element name="Zip">
    <xs:complexType>
      <xs:attribute name="Value" use="required" type="xs:string"/>
    </xs:complexType>
  </xs:element>

</xs:schema>
Run Code Online (Sandbox Code Playgroud)

您需要扩展该架构以处理<SomeOtherCrazyValue>转换输出中的其他元素.或者你可以将xsl变换结构化为不发出不属于{State,Street,Zip}的元素.

为了清楚起见,我了解到您无法更改收到的XML.这种方法不需要这样做.它只是使用时髦的两步验证方法.第二个验证步骤完成后,您可以放弃转换的结果.


编辑 - 实际上,Sean,再考虑一下,你可以只使用步骤B.假设你的XSL转换只是从文档中删除<Address>没有State,Street或Zip的Field属性值的元素.换句话说,就没有了<Address Field="SomeOtherCrazyValue"...>.可以使用您的模式验证该变换的结果,使用maxOccurs ="3",minOccurs ="3"和xs:unique.