gpt4 book ai didi

java - 使用 SAX 进行解析时如何保留未绑定(bind)到对象的 XML 节点

转载 作者:塔克拉玛干 更新时间:2023-11-02 21:18:06 25 4
gpt4 key购买 nike

我正在开发一个与蓝牙相机接口(interface)的安卓应用程序。对于存储在相机上的每个剪辑,我们在 XML 文件中存储有关剪辑的一些字段(其中一些字段用户可以更改)。

目前这个应用程序是唯一将此 xml 数据写入设备的应用程序,但将来桌面应用程序或 iphone 应用程序也可能会在此处写入数据。我不想假设另一个应用程序也不能有额外的字段(特别是如果他们有一个更新版本的应用程序添加了这个版本尚不支持的新字段)。

所以我想防止的情况是,我们在另一个应用程序中向这个 XML 文件添加新字段,然后用户去使用 android 应用程序,它会删除​​那些其他字段,因为它不知道它们.

让我们举个假设的例子:

<data>
<title>My Title</title>
<date>12/24/2012</date>
<category>Blah</category>
</data>

当从设备读取时,这将被翻译成一个看起来像这样的 Clip 对象(为简洁起见进行了简化)

public class Clip {
public String title, category;
public Date date;
}

所以我使用 SAX 来解析数据并将其存储到 Clip 中。我只是将字符存储在 StringBuilder 中,并在到达标题、类别和日期的结束元素时将它们写出。

我意识到,当我将这些数据写回设备时,如果原始文档中有任何其他标签,它们将不会被写入,因为我只写出我知道的字段。

这让我觉得 SAX 可能是错误的选择,也许我应该使用 DOM 或其他我可以更轻松地写出最初存在的任何其他元素的东西。

或者我在想,也许我的 Clip 类包含一些通用 XML 类型(可能是 DOM)的 ArrayList,并且在 startTag 中我检查该元素是否不是预定义标签之一,如果是,直到我到达结尾那个标签我存储了整个结构(但是在什么?)..然后写回我会遍历所有额外的标签并将它们写到 xml 文件中(当然还有我知道的字段)

这是已知解决方案的常见问题吗?

-- 2012 年 5 月 22 日更新 --

我没有提到在实际的 xml 根节点(实际上称为注释)中,我们使用已设置为 1 的版本号。短期内我要做的是要求版本我的应用程序支持的数字是 >= xml 数据的版本号。如果 xml 的数量更大,我将尝试解析以进行回读,但会拒绝对模型进行任何保存。尽管关于如何执行此操作,但我仍然对任何类型的工作示例感兴趣。

顺便说一句,我想到了另一个应该很简单的解决方案。我想我可以使用 XPATH 来查找我知道的节点,并在数据更新时替换这些节点的内容。然而,我运行了一些基准测试,当它被解析到内存中时,解析 xml 的开销是荒谬的。仅仅没有进行任何查找的解析操作导致性能比 SAX 差 20 倍。使用 xpath 进行解析通常要慢 30-50 倍,考虑到我在 ListView 中解析这些,这真的很糟糕。所以我的想法是让 SAX 将节点解析为剪辑,但将整个 XML 存储在 Clip 类的一个变量中(记住,这个 xml 很短,不到 2kb)。然后,当我写回数据时,我可以使用 XPATH 替换我在原始 XML 中知道的节点。

但仍然对任何其他解决方案感兴趣。我可能不会接受解决方案,除非它包含一些代码示例。

最佳答案

以下是使用 SAX filters 的方法:

  1. 当您使用 SAX 阅读文档时,您会记录所有事件。您记录它们并将它们进一步冒泡到 SAX 阅读器的下一个级别。您基本上将两层 SAX 读取器(使用 XMLFilter)堆叠在一起 - 一层将记录和中继,另一层是您当前创建对象的 SAX 处理程序。
  2. 当您准备好将您的修改写回磁盘时,您会启动与您的编写器分层的记录的 SAX 事件,这些事件将覆盖您已更改的那些值/节点。

我花了一些时间研究这个想法,它奏效了。它基本上归结为 XMLFilter 的正确链接。方法如下 the unit test看起来,您的代码会做类似的事情:

final SAXParserFactory factory = SAXParserFactory.newInstance();
final SAXParser parser = factory.newSAXParser();

final RecorderProxy recorder = new RecorderProxy(parser.getXMLReader());
final ClipHolder clipHolder = new ClipHolder(recorder);

clipHolder.parse(new InputSource(new StringReader(srcXml)));

assertTrue(recorder.hasRecordingToReplay());

final Clip clip = clipHolder.getClip();
assertNotNull(clip);
assertEquals(clip.title, "My Title");
assertEquals(clip.category, "Blah!");
assertEquals(clip.date, Clip.DATE_FORMAT.parse("12/24/2012"));

clip.title = "My Title Updated";
clip.category = "Something else";

final ClipSerializer serializer = new ClipSerializer(recorder);
serializer.setClip(clip);

final TransformerFactory xsltFactory = TransformerFactory.newInstance();
final Transformer t = xsltFactory.newTransformer();
final StringWriter outXmlBuffer = new StringWriter();

t.transform(new SAXSource(serializer,
new InputSource()), new StreamResult(outXmlBuffer));

assertEquals(targetXml, outXmlBuffer.getBuffer().toString());

重要的几行是:

  • 你的 SAX events recorder包裹在 SAX 解析器中
  • 您的 Clip 解析器 ( ClipHolder ) 环绕在记录器上
  • 解析 XML 时,记录器将记录所有内容,而您的 ClipHolder 将只查看它知道的内容
  • 然后你可以用the clip object做任何你需要做的事
  • serializer然后缠绕在录音机上(基本上是将其重新映射到自身上)
  • 然后您使用序列化程序,它将负责提供记录的事件(委托(delegate)给父级并将 self 注册为 ContentHandler)并覆盖它所具有的内容说说 clip 对象。

请找到DVR代码和Clip测试 over at github 。希望对您有所帮助。

附注它不是一个通用的解决方案,整个记录->重播+覆盖概念在提供的实现中是非常基本的。基本上是一个插图。如果您的 XML 更复杂并且变得“多毛”(例如,不同级别上的相同元素名称等),则需要扩充逻辑。这个概念将保持不变。

关于java - 使用 SAX 进行解析时如何保留未绑定(bind)到对象的 XML 节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10648651/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com