在使用SAX进行解析时,如何保留未绑定到对象的XML节点

Mat*_*lfe 6 java xml android sax

我正在开发一个与蓝牙相机接口的Android应用程序.对于存储在相机上的每个剪辑,我们在XML文件中存储关于剪辑的一些字段(其中一些用户可以更改).

目前这个应用程序是唯一一个将此xml数据写入设备的应用程序,但将来有可能桌面应用程序或iphone应用程序也可能在此处写入数据.我不想假设另一个应用程序也没有其他字段(特别是如果他们有一个新版本的应用程序添加了这个版本尚不支持的新字段).

所以我想要防止的是我们在另一个应用程序中向这个XML文件添加新字段的情况,然后用户开始使用android应用程序并清除其他字段,因为它不知道它们.

让我们假设一个例子:

<data>
  <title>My Title</title>
  <date>12/24/2012</date>
  <category>Blah</category>
</data>
Run Code Online (Sandbox Code Playgroud)

当从设备读取时,这将被转换为看起来像这样的Clip对象(简化为简洁起见)

public class Clip {
  public String title, category;
  public Date date;
}
Run Code Online (Sandbox Code Playgroud)

所以我使用SAX来解析数据并将其存储到Clip中.我只是将字符存储在StringBuilder中,当我到达标题,类别和日期的结束元素时将它们写出来.

我意识到,当我将这些数据写回设备时,如果原始文档中有任何其他标签,则它们不会被写入,因为我只写出我所知道的字段.

这让我觉得SAX可能是错误的选择,也许我应该使用DOM或其​​他东西,我可以更容易地写出最初存在的任何其他元素.

或者我想也许我的Clip类包含一些通用XML类型的ArrayList(可能是DOM),并且在startTag中我检查该元素是否不是预定义标记之一,如果是,直到我到达该标记的末尾我存储整个结构(但在什么?)..然后在写回来时,我将浏览所有其他标签并将它们写出到xml文件(以及我当然知道的字段)

这是一个众所周知的解决方案的常见问题吗?

- 更新5/22/12 -

我没有在实际的xml中提到根节点(实际上称为注释),我们使用的版本号已设置为1.我将要做的短期内要求我的应用程序的版本号支持是> = xml数据的版本号是什么.如果xml是一个更大的数字,我将尝试解析回读,但将拒绝对模型的任何保存.关于如何做到这一点,我仍然对任何工作实例感兴趣.

顺便说一下,我想到了另一个应该非常简单的解决方案.我想我可以使用XPATH查找我知道的节点,并在更新数据时替换这些节点的内容.但是我运行了一些基准测试,当解析xml到内存中时,开销是荒谬的.只是解析操作甚至没有进行任何查找导致性能比SAX差20倍.使用xpath一般来说解析速度慢30-50倍,考虑到我在列表视图中解析它们,这真的很糟糕.所以我的想法是让SAX将节点解析为剪辑,但是将整个XML存储在Clip类的变量中(记住,这个xml很短,小于2kb).然后,当我将数据写回来时,我可以使用XPATH来替换原始XML中我知道的节点.

仍然对任何其他解决方案感兴趣.除非它包含一些代码示例,否则我可能不会接受解决方案.

Pav*_*ler 1

以下是使用SAX 过滤器的方法:

  1. 当您使用 SAX 读取文档时,您会记录所有事件。您记录它们并将它们进一步冒泡到 SAX 读取器的下一个级别。您基本上将两层 SAX 读取器(使用XMLFilter )堆叠在一起- 一层将记录和中继,另一层是创建对象的当前 SAX 处理程序。
  2. 当您准备好将修改写回磁盘时,您将启动与编写器分层的记录的 SAX 事件,这将覆盖您已更改的那些值/节点。

我花了一些时间思考这个想法并且它奏效了。它基本上归结为XMLFilters 的正确链接。单元测试如下所示,您的代码将执行类似的操作:

final SAXParserFactory factory = SAXParserFactory.newInstance();
final SAXParser parser = factory.newSAXParser();

final RecorderProxy recorder = new RecorderProxy(parser.getXMLReader());
final ClipHolder clipHolder = new ClipHolder(recorder);

clipHolder.parse(new InputSource(new StringReader(srcXml)));

assertTrue(recorder.hasRecordingToReplay());

final Clip clip = clipHolder.getClip();
assertNotNull(clip);
assertEquals(clip.title, "My Title");
assertEquals(clip.category, "Blah!");
assertEquals(clip.date, Clip.DATE_FORMAT.parse("12/24/2012"));

clip.title = "My Title Updated";
clip.category = "Something else";

final ClipSerializer serializer = new ClipSerializer(recorder);
serializer.setClip(clip);

final TransformerFactory xsltFactory = TransformerFactory.newInstance();
final Transformer t = xsltFactory.newTransformer();
final StringWriter outXmlBuffer = new StringWriter();

t.transform(new SAXSource(serializer, 
            new InputSource()), new StreamResult(outXmlBuffer));

assertEquals(targetXml, outXmlBuffer.getBuffer().toString());
Run Code Online (Sandbox Code Playgroud)

重要的几行是:

  • 您的SAX 事件记录器包含在 SAX 解析器中
  • 你的Clip解析器 ( ClipHolder) 包裹在记录器中
  • 当解析 XML 时,记录器将记录所有内容,您ClipHolder只会查看它所知道的内容
  • 然后你可以对这个对象做任何你需要做的事情clip
  • 然后将序列化器包裹在记录器周围(基本上将其重新映射到自身上)
  • 然后,您使用序列化器,它将负责提供记录的事件(委托给父级并注册self为 a ContentHandler),并覆盖有关该clip对象的内容。

请在 github 上找到 DVR 代码和Clip测试。我希望它有帮助。

PS这不是一个通用的解决方案,整个记录->重播+覆盖概念在提供的实现中非常初级。基本上是一个插图。如果您的 XML 更复杂并且变得“毛茸茸的”(例如,不同级别上的相同元素名称等),则需要增强逻辑。但这个概念将保持不变。