gpt4 book ai didi

python - “ascii”编解码器在执行 bs 时无法解码字节 0xcb

转载 作者:太空宇宙 更新时间:2023-11-03 16:17:00 25 4
gpt4 key购买 nike

我通过 Merriam-Webster 的 API 将 xml 页面保存在本地,让我给您 url: http://www.dictionaryapi.com/api/v1/references/collegiate/xml/apple?key=bf534d02-bf4e-49bc-b43f-37f68a0bf4fd

这是一个例子。我从 url 中检索它并将其保存为 xml 文件。

现在我想打开它,但是一个 UnicodeDecodeError发生。

我做到了:

page = open('test.xml')
bs = BeautifulSoup(page)

然后出现以下错误:

UnicodeDecodeError: 'ascii' codec can't decode byte 0xcb

我尝试将网址设置为 u'test.xml'它不起作用。

sys.getdefaultencoding() 'utf-8'

编码配置已经是utf-8,并不能解决问题,还是谢谢你的建议。

最佳答案

您需要将编码指定为 utf-8,这就是数据的编码方式,文件名与内部内容无关,因此使用 u 前缀来生成 unicode 字符串不会有帮助:

import io
with io.open('test.xml', encoding="utf-8") as page:
bs = BeautifulSoup(page)

关于python - “ascii”编解码器在执行 bs 时无法解码字节 0xcb,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38869956/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com