gpt4 book ai didi

python sax解析器跳过异常

转载 作者:数据小太阳 更新时间:2023-10-29 02:46:29 25 4
gpt4 key购买 nike

有没有办法使用 SAX XML 解析器“跳过”一行?

我有一个非确认 XML 文档,它是有效 XML 文档的串联,因此是 <?xml ...?>出现在每个文档中。另请注意,我需要使用 SAX 解析器,因为输入文档很大。

我尝试制作一个“自定义流”类作为解析器的供给器,但很快意识到 SAX 使用 read方法,从而读取“字节数组”中的内容,从而激增该项目的复杂性。

谢谢!

更新:我知道使用 csplit 可以解决这个问题但如果在合理的范围内可能的话,我会寻求基于 Python 的解决方案。

更新 2: 也许我应该说“跳到下一个文档”,这样更有意义。无论如何,这就是我需要的:一种从单个输入流中解析多个文档的方法。

最佳答案

当您将文档连接在一起时,只需替换开头的 以及 <!-- 和 -->,这将注释掉 xml 声明。

关于python sax解析器跳过异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6344070/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com