gpt4 book ai didi

python - 将utf-8编码的字符串转换为python 3中的纯文本

转载 作者:太空宇宙 更新时间:2023-11-04 01:12:35 25 4
gpt4 key购买 nike

所以我一直都在使用 unicode 和 utf-8,因为我有一个脚本可以从网上抓取图像和它们的标题。效果很好,除非他们的标题有特殊字符(例如 Jökulsárlón。)

输出为 unicode :-

J\\xc3\\xb6kuls\\xc3\\xa1rl\\xc3\\xb3n

所以我想要一种将该字符串转换为纯文本的方法——无论是将它们转换为最接近的“普通”字母(如普通 o 而不是 ö)还是打印那些实际符号(而不是\xc3 等)我已经尝试了十亿种不同的方法,但我一直在阅读的很多东西在 python 3 中对我不起作用。

提前致谢

最佳答案

它确实是 UTF-8 但它们是字节:

>>> b = b'J\xc3\xb6kuls\xc3\xa1rl\xc3\xb3n'
>>> b
b'J\xc3\xb6kuls\xc3\xa1rl\xc3\xb3n'
>>> b.decode('utf-8')
'Jökulsárlón'

因为这是 Python 3.x,所以这是一个 Unicode 字符串。

关于python - 将utf-8编码的字符串转换为python 3中的纯文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26865276/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com