gpt4 book ai didi

Python:NULL 字节或控制字符

转载 作者:行者123 更新时间:2023-12-05 07:58:40 24 4
gpt4 key购买 nike

我目前正在使用 lxml。我正在设置属性,但出现以下错误:

ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters

多年来我一直使用同一个脚本,直到现在我还没有遇到任何问题(我有新文件要处理)。

如何处理空字节或控制字符?最好的解决方案可能是忽略它们。但如何做到这一点?

我像这样设置新字符串:

w.set("lem", newString)

在 Jack 的帮助下,我知道是以下原因导致了错误:

"Bad string is: 'Bo\xdf'".

我该如何处理这种情况?

编辑:使用此功能:

from curses import ascii
def clean(text):
return str(''.join(
ascii.isprint(c) and c or '?' for c in text
))

我不再收到任何错误。但是代码设置了很多“?”。代替“?”,我想要正确的字符(在 utf-8 中)...

最佳答案

要调试您的问题,请像这样临时修改您的代码:

try:
w.set("lem", newString")
except ValueError:
print("Bad string is: "+newString)

然后您可以看到字符串是什么并找出错误所在以及如何处理。

关于Python:NULL 字节或控制字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23956804/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com