gio*_*412 3 java saxparser xml-parsing
我想使用SAX解析器从xml文件解析一些数据.我的xml如下:
<categories>
<cat>Pies & past</cat>
<cat>Fruits</cat>
</categories>
Run Code Online (Sandbox Code Playgroud)
为了解析这些数据,我扩展了DefaultHandler.
解析后的输出是:
cat 1 = Pies
cat 2 = &
cat 3 = past
cat 4 = Fruits
Run Code Online (Sandbox Code Playgroud)
为什么会发生这种情况而不是:
cat 1 = Pies & past
cat 2 = Fruits
Run Code Online (Sandbox Code Playgroud)
我的猜测是,您将每个调用characters视为传递cat元素的完整文本.您应该对处理程序进行编码,以便连续调用以characters累积文本,并且只在endElement事件上捕获它:
public class CatHandler extends DefaultHandler {
private StringBuilder chars = new StringBuilder();
public void startElement(String uri, String lName, String qName, Attributes a)
{
final String name = qName == null ? lName : qName;
if ("cat".equals(name)) {
chars.setLength(0);
} else . . .
}
public void endElement(String uri, String lName, String qName) {
final String name = qName == null ? lName : qName;
if ("cat".equals(name)) {
String catName = chars.toString();
// do something with cat name
} else . . .
}
public void characters(char[] ch, int start, int length) {
chars.append(ch, start, length);
}
Run Code Online (Sandbox Code Playgroud)