通过DOM解析器从XML处理CDATA

Lee*_*Lee 3 java xml dom cdata

我以前从未处理过XML,所以我不确定如何在XML文件中处理CDATA.我迷失在节点,父节点,子节点,nList等中.

谁能告诉我这些代码片段的问题是什么?

我的getTagValue()方法适用于除"详细信息"之外的所有标记,"详细信息"是包含CDATA的标记.

.....
NodeList nList = doc.getElementsByTagName("Assignment");
for (int temp = 0; temp < nList.getLength(); temp++) {
    Node nNode = nList.item(temp);
    if (nNode.getNodeType() == Node.ELEMENT_NODE) {
        Element eElement = (Element) nNode;
        results = ("Class : " + getTagValue("ClassName", eElement)) + 
                  ("Period : " + getTagValue("Period", eElement)) +
                  ("Assignment : " + getTagValue("Details", eElement));
        myAssignments.add(results);
    }
}
.....
private String getTagValue(String sTag, Element eElement) {
    NodeList nlList = eElement.getElementsByTagName(sTag).item(0).getChildNodes();

    Node nValue = (Node) nlList.item(0);
    if((CharacterData)nValue instanceof CharacterData)
    {
        return ((CharacterData) nValue).getData();
    }
    return nValue.getNodeValue();
}
Run Code Online (Sandbox Code Playgroud)

Bog*_*dan 5

我怀疑你的问题出在该方法的以下代码行中getTagValue:

Node nValue = (Node) nlList.item(0);
Run Code Online (Sandbox Code Playgroud)

你总是得到第一个孩子!但是你可能不止一个.

以下示例有3个子节点:文本节点"detail",CDATA节点"with cdata"和文本节点"here":

<Details>detail <![CDATA[with cdata]]> here</Details>
Run Code Online (Sandbox Code Playgroud)

如果你运行你的代码,你只得到"细节",你就会失去其余部分.

以下示例有1个子节点:CDATA节点"此处带有cdata的详细信息":

<Details><![CDATA[detail with cdata here]]></Details>
Run Code Online (Sandbox Code Playgroud)

如果你运行你的代码,你会得到一切.

但是上面这样写的例子如下:

<Details>
   <![CDATA[detail with cdata here]]>
</Details>
Run Code Online (Sandbox Code Playgroud)

现在有3个孩子因为空格和换行被选为文本节点.如果您运行代码,则会获得带有换行符的第一个空文本节点,其余部分将丢失.

您要么遍历所有子项(无论多少)并连接每个子项的值以获得完整结果,或者如果区分纯文本和CDATA内的文本并不重要,则coalescing在文档上设置属性建筑工厂第一:

DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance();
docFactory.setCoalescing(true);
...
Run Code Online (Sandbox Code Playgroud)

Coalescing指定此代码生成的解析器将CDATA节点转换为Text节点,并将其附加到相邻(如果有)文本节点.默认情况下,this的值设置为false.