gpt4 book ai didi

python - XML 解析 - ^H 字符/符号?

转载 作者:行者123 更新时间:2023-12-01 05:58:33 26 4
gpt4 key购买 nike

我在尝试清理一些 XML 以便可以使用 etree 在 Python 中解析它时遇到了非常糟糕的时间。基本上在我的 Python 脚本读取它之前,我试图转义每个字符串条目中给我的所有特殊字符

'xml.parsers.expat.ExpatError: not well-formed'

因此,当我生成 XML 字符串条目时,我会使用 sed 将特殊字符替换为其转义版本或只是一个 空格(当我确实不这样做时)不在乎。

但是现在在我生成的 XML 中我看到一个 ^H 字符,vim 已将其突出显示为蓝色。

我尝试转义 ^ 但这不起作用,该字符仍然存在,所以我认为它一定是某种复合特殊字符。

唉,为什么这这么糟糕。无论如何,感谢您的帮助。

最佳答案

^H 是表示嵌入文本中的退格字符(ASCII 字符 8)的常用方法;如果您已经使用 sed/bash 进行过滤,您可以执行以下操作:

cat infile | sed s/$'\b'// > outfile

不过,我不认为你的输入文件中首先有一个 ^H 是一件好事......你是如何生成它的?

关于python - XML 解析 - ^H 字符/符号?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11458392/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com