gpt4 book ai didi

python3 : Unescape unicode escapes surrounded by unescaped characters

转载 作者:太空宇宙 更新时间:2023-11-03 14:25:12 25 4
gpt4 key购买 nike

我收到了 json 数据,其中一些 unicode 字符被转义,而另一些则没有。

>>> example = r'сло\u0301во'

转义这些字符的最佳方法是什么?在下面的示例中,函数 unescape 是什么样的?是否有内置函数可以执行此操作?

>>> unescape(example)
сло́во

最佳答案

此解决方案假设原始字符串中 \u 的每个实例都是 unicode 转义:

def unescape(in_str):
"""Unicode-unescape string with only some characters escaped."""
in_str = in_str.encode('unicode-escape') # bytes with all chars escaped (the original escapes have the backslash escaped)
in_str = in_str.replace(b'\\\\u', b'\\u') # unescape the \
in_str = in_str.decode('unicode-escape') # unescape unicode
return in_str

...或在一行中...

def unescape(in_str):
"""Unicode-unescape string with only some characters escaped."""
return in_str.encode('unicode-escape').replace(b'\\\\u', b'\\u').decode('unicode-escape')

关于python3 : Unescape unicode escapes surrounded by unescaped characters,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47685575/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com