pho*_*594 4 java xml parsing dom
我有一个关于XML,Java使用DOM和空节点的问题.我目前正在开发一个项目,其中我采用抽象机器的XML描述符文件(用于文本解析)并用它们解析一系列输入字符串.这些抽象机器的实际构建和解释都已完成且工作正常,但我遇到了一个相当有趣的XML要求.具体来说,我需要能够将空的InputString节点转换为空字符串("")并仍然执行我的解析例程.但是,当我尝试从XML树中提取此空白节点时,会出现此问题.这会导致空指针异常,然后通常会发生坏事.这是令人讨厌的XML片段(注意第一个元素是空的):
<InputStringList>
<InputString></InputString>
<InputString>000</InputString>
<InputString>111</InputString>
<InputString>01001</InputString>
<InputString>1011011</InputString>
<InputString>1011000</InputString>
<InputString>01010</InputString>
<InputString>1010101110</InputString>
</InputStringList>
Run Code Online (Sandbox Code Playgroud)
我使用以下方法从列表中提取字符串:
//Get input strings to be validated
xmlElement = (Element)xmlMachine.getElementsByTagName(XML_INPUT_STRING_LIST).item(0);
xmlNodeList = xmlElement.getElementsByTagName(XML_INPUT_STRING);
for (int j = 0; j < xmlNodeList.getLength(); j++) {
//Add input string to list
if (xmlNodeList.item(j).getFirstChild().getNodeValue() != null) {
arrInputStrings.add(xmlNodeList.item(j).getFirstChild().getNodeValue());
} else {
arrInputStrings.add("");
}
}
Run Code Online (Sandbox Code Playgroud)
我应该如何处理这个空案件?我发现了很多关于删除空白文本节点的信息,但实际上我仍然必须将空白节点解析为空字符串.理想情况下,我想避免使用特殊字符来表示空白字符串.
提前谢谢您的时间.
if (xmlNodeList.item(j).getFirstChild().getNodeValue() != null) {
Run Code Online (Sandbox Code Playgroud)
nodeValue不应该是空的; 它firstChild本身可能是null,应检查:
Node firstChild= xmlNodeList.item(j).getFirstChild();
arrInputStrings.add(firstChild==null? "" : firstChild.getNodeValue());
Run Code Online (Sandbox Code Playgroud)
但请注意,这仍然只对一个文本节点的内容敏感.如果你有一个元素与另一个元素,或一些文本和CDATA部分,只是获取第一个孩子的价值不足以阅读整个文本.
你真正想要的是来自DOM Level 3 Core 的textContent属性,它将为你提供元素内的所有文本,无论如何包含.
arrInputStrings.add(xmlNodeList.item(j).getTextContent());
Run Code Online (Sandbox Code Playgroud)
这在Java 1.5及更高版本中可用.