gpt4 book ai didi

Python:如何分割字符串但保留非字母数字字符

转载 作者:行者123 更新时间:2023-12-01 01:41:23 45 4
gpt4 key购买 nike

我在处理这个问题时遇到问题:

Sample string - \"H\00E6tta\"

*\00E6 是一个 unicode,我的脚本能够理解它,尽管不是通常的形式\u00e6。所以请不要担心这部分。

分割后我希望得到类似的结果:

['', '"H', "00E6tta", '"'] - first white column is normal as nothing before the '\' when I split

我这样做了:

sub_glyph = glyph.split("\\")

但是这是我得到的结果:

['', 'H', '00E6tta', '']

有什么线索吗?我需要将 "转换为 unicode。但它现在丢失了。我很困惑,我认为我相应地拆分为 '\' 以及为什么 "会消失。在线找不到任何资源丰富的指南,需要帮助。

谢谢

最佳答案

使用原始字符串(在字符串前面添加 r 使其成为原始字符串)并分割它:

s = r'\"H\00E6tta\"'

print(s.split('\\'))
# ['', '"H', '00E6tta', '"']

注意:当我们将 s 设为原始字符串时,“文字”字符串(此处)实际上更改为 \\"H\\00E6tta\\“(使用 repr(s) 查看更改)。这使得我们的分割成为可能。

关于Python:如何分割字符串但保留非字母数字字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51853294/

45 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com