gpt4 book ai didi

python - 如何使用 python 将 unicode 元组列表转换为 utf-8

转载 作者:太空宇宙 更新时间:2023-11-03 12:49:03 25 4
gpt4 key购买 nike

我的函数返回一个元组然后将其分配给变量 x 并附加到列表中。

x = (u'string1', u'string2', u'string3', u'string4')
resultsList.append(x)

多次调用该函数,最终列表由20个元组组成。

元组中的字符串是 unicode,我想将它们转换为 utf-8。

一些字符串还包含非 ASCII 字符,如 ö、ä 等。

有没有一种方法可以一步转换它们?

最佳答案

使用嵌套列表理解:

encoded = [[s.encode('utf8') for s in t] for t in resultsList]

这会生成一个列表列表,其中包含 UTF-8 编码数据的字节字符串。

如果您要打印这些列表,您会看到 Python 将 Python 字节字符串的内容表示为 Python 文字字符串;带引号和任何不可打印的字节 ASCII 代码点用转义序列表示:

>>> l = ['Kaiserstra\xc3\x9fe']
>>> l
['Kaiserstra\xc3\x9fe']
>>> l[0]
'Kaiserstra\xc3\x9fe'
>>> print l[0]
Kaiserstraße

这是正常,因为 Python 出于调试目的提供此数据。 \xc3\x9f 转义序列代表两个 UTF-8 字节 C39F(十六进制),用于对小 ringel-es 字符进行编码。

关于python - 如何使用 python 将 unicode 元组列表转换为 utf-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17527072/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com