看来,这种方法的行为在Java 8中发生了变化.我需要一些快速解决我的问题.
问题是我有一些代码在每个命名的XML节点之后写入CR和LF <row>.现在(当我们迁移到Java 8时),而不是CR和LF,这些字符
被写出来.
同样,我需要一个快速修复,我不能改变StaX实现或做那样大的事情.
while (reader.hasNext()){
event = reader.next();
if (event == XMLStreamConstants.START_ELEMENT){
if (reader.getLocalName().equals("row")){
writer.writeCharacters("\r\n"); /// this is my problem now!!!
writer.writeStartElement(reader.getLocalName());
n = reader.getAttributeCount();
for (int i=0; i<n; i++){
name = reader.getAttributeName(i).getLocalPart();
value = reader.getAttributeValue(i);
...
}
}
Run Code Online (Sandbox Code Playgroud)
您需要访问底层编写器,即您用 XMLStreamWriter 装饰的编写器(希望如果有的话,它将是您传递给的编写器createXMLStreamWriter()),或者您需要暂时禁用与实现相关的转义。
得到奇怪字符的原因是 XMLStreamWriter 不知道您在哪里编写这些字符,因此它默认为XML 属性转义,这比元素(内容)转义更严格。转义一般也是基于CharacterEncoder. 我的猜测是,在旧版本的 Java 中,它默认使用 XML 元素转义,它不会像换行符一样转义空白,或者使用不同的字符编码。我可以明白为什么他们解决了这个问题,因为显然属性转义是正确的方法。我也不知道您实际使用的是哪一个XMLStreamWriter,CharacterEncoder可能更可能发生的是默认选择的 XMLStreamWriter 或字符编码实现发生了变化(您应该在调试器中检查选择了哪一个)。
无论您是否可以访问底层编写器,您都可以直接编写字符,并且它们不会被转义。但是,请确保您使用的编写器是经过修饰的编写器,而不是更深的编写器(即,如果您有一个 BufferWriter 装饰 FileWriter,请使用 BufferWriter)。
对于那些认为writeCharacters 没有转义的人,您可以查看代码。
编辑
显然,在查看代码之后,您可以在writer.setEscapeCharacters(false)调用之前调用默认的 sun impl(不幸的是,您可能必须进行一些转换),writeCharacters这可能比获取原始作者更好。我不知道这个标志。
编辑2
如果您希望使用 Sun StaX 实现,另一个可能的快速解决方法是更改系统级字符编码并选择编码,以便 CRLF 不会理想地转义为 JDK 升级之前的状态。这是假设问题可能是你的字符编码在 Java 升级时从 Windows 或 ISO 更改为 UTF-8,但我不能确定,因为你没有指定你的操作系统。如果升级时它没有改变(即希望您始终默认为 UTF-8),则忽略此选项。
编辑3
经过一些测试后,我非常肯定您的 StaX 实现不是默认的 Java Sun 实现,而可能是Woodstox。我还没有测试过 Woodstox,但出于性能原因,该库似乎非常关心空白,并且如果它是 UTF-8 和 ISO(同样是字符编码),则似乎有不同的规则。
| 归档时间: |
|
| 查看次数: |
1666 次 |
| 最近记录: |