gpt4 book ai didi

Python:西里尔字母处理

转载 作者:太空狗 更新时间:2023-10-30 03:01:57 25 4
gpt4 key购买 nike

我从 API 返回的数据 b'\\u041a\\u0435\\u0439\\u0442\\u043b\\u0438\\u043d\\u043f\\u0440\\u043e .这些数据是俄语的,我很确定。我猜这些值是西里尔字母的 unicode 表示?

返回的数据是字节数组。

如何将其转换为可读的西里尔字符串?我非常需要一种方法将那种转换为可读的人类文本。

编辑:是的,这是 JSON 数据。忘了说了,不好意思。

最佳答案

您很可能拥有 JSON 数据; JSON 使用 \uhhhh 转义序列来表示 Unicode 代码点。使用 json.loads() functionunicode(解码)数据上生成 Python 字符串:

import json

string = json.loads(data.decode('utf8'))

UTF-8 是默认的 JSON 编码;检查您的响应 header (如果您使用的是基于 HTTP 的 API)以查看是否使用了不同的编码。

演示:

>>> import json
>>> json.loads(b'"\\u041a\\u0435\\u0439\\u0442\\u043b\\u0438\\u043d\\u043f\\u0440\\u043e"'.decode('utf8'))
'Кейтлинпро'

关于Python:西里尔字母处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23896124/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com