gpt4 book ai didi

python - 从文件中删除

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:15:44 26 4
gpt4 key购买 nike

我正在使用 this将 CSV 转换为 XML 的 Python 脚本。转换后我在文本 (vim) 中看到标签,这导致 XML 解析错误。

enter image description here

我已经尝试过来自 here 的答案, 没有成功。

转换后的 XML file .

感谢您的帮助!

最佳答案

您的输入文件包含 BOM(字节顺序标记)字符,当文件以 utf8 编码时,Python 不会自动去除它们。请参阅:Reading Unicode file data with BOM chars in Python

>>> s = '\xef\xbb\xbfABC'
>>> s.decode('utf8')
u'\ufeffABC'
>>> s.decode('utf-8-sig')
u'ABC'

所以对于你的具体情况,尝试类似的东西

from io import StringIO
s = StringIO(open(csvFile).read().decode('utf-8-sig'))
csvData = csv.reader(s)

非常糟糕的风格,但该脚本无论如何都是为一次性工作而拼凑而成的脚本。

关于python - 从文件中删除 <feff>,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22366252/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com