gpt4 book ai didi

python - 使用 lxml 和 xpath 解析 xml 文件时如何保留 &

转载 作者:行者123 更新时间:2023-12-02 01:26:22 25 4
gpt4 key购买 nike

我试图从输入 xml 文件中提取一些信息,并使用 lxml 和 xpath 指令将其打印到输出文件中。我在读取如下所示的 xml 标签时遇到问题

...
<editor> Barnes &amp; Nobel </editor>
...

为了解析xml文件并打印我使用的编辑器内容(xml中始终只有一个编辑器):

parser = etree.XMLParser(encoding='utf-8')
docTree = etree.parse( io.BytesIO(open(inputXML, "r").read()), parser )
print docTree.xpath('//editor')[0].text

我的问题是 & 在某个时刻被转换为 '&',这扰乱了我的进一步处理。

如何确保&符号不会被“解码”?

最佳答案

我知道这听起来有些自以为是,但您希望数据为 "&"。这是 XML 元素的文本内容。如果稍后的处理需要将其编码为 "&",那么您需要一个步骤将 XML(或 HTML-)编码回 "&" ,

您不能要求 XML 解析器解析您的文档而不将 "&" 转换为 "&"。它不会这样做。

关于python - 使用 lxml 和 xpath 解析 xml 文件时如何保留 &,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27207971/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com