gpt4 book ai didi

python - 修复被(一些)转义反斜杠破坏的 unicode 字符串

转载 作者:太空宇宙 更新时间:2023-11-04 02:26:40 24 4
gpt4 key购买 nike

<分区>

我在看这个问题:python3 replacing double backslash with single backslash [duplicate]

并筛选对类似问题的回答:Python Replace \ with \ , Why can't Python's raw string literals end with a single backslash?, How do I unescape a unicode escaped string in python?

当我意识到没有一个答案能真正解决这个问题时。假设我有一个损坏的 unicode 字符串,它包含两个转义反斜杠和转义字符:

my_str = '\\xa5\\xc0\\xe6aK\xf9\\x80\\xb1\\xc8*\x01\x12$\\xfbp\x1e(4\\xd6{;Z'

当我打印它时,一些字符会计算:

print(my_str)
\xa5\xc0\xe6aKù\x80\xb1\xc8*☺↕$\xfbp▲(4\xd6{;Z

我可以像这样手动修复它:

my_str = repr(my_str)
my_str
"'\\\\xa5\\\\xc0\\\\xe6aKù\\\\x80\\\\xb1\\\\xc8*\\x01\\x12$\\\\xfbp\\x1e(4\\\\xd6{;Z'"
my_str = my_str.replace('\\\\','\\')
print(my_str)
'\xa5\xc0\xe6aKù\x80\xb1\xc8*\x01\x12$\xfbp\x1e(4\xd6{;Z'

但此时我必须手动将打印结果复制并粘贴到一个变量中以完成修复:

my_str = '\xa5\xc0\xe6aKù\x80\xb1\xc8*\x01\x12$\xfbp\x1e(4\xd6{;Z'
print(my_str)
¥ÀæaKù±È*☺↕$ûp▲(4Ö{;Z

如何在不复制和粘贴的情况下执行此操作?

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com