gpt4 book ai didi

python - 无法拆分看似已编码的字符串

转载 作者:行者123 更新时间:2023-11-28 21:59:44 24 4
gpt4 key购买 nike

在解析来自网络请求的数据时,我遇到了以下字符串 -

dateRange = 'September\xa04,\xa01978 – September 1980'

提取字符串的编码似乎是 Latin-1(基于 \xa0)。我通过用空格替换代码来摆脱它。

dateRange = dateRange.replace(u'\xa0', u' ')

撇开这一点,我无法在连字符 (-) 上拆分字符串。

当我如下调用 split() 时:

print(dateRange.split('-'))

输出如下:

['September\xa04,\xa01978 – September 1980']

就好像字符串中没有连字符一样。我感觉它与编码有关,但我似乎无法完全理解这个问题。

那么,如何解决这个问题呢?

编辑:

我已经尝试了以下方法但无济于事:

dateRange.split('\-')

最佳答案

那不是 hyphen .那是一个 U+2013 ᴇɴ ᴅᴀsʜ .

只需将其复制并粘贴到您的拆分调用中:

dateRange.split('–')

或者,您可以将其替换为实际的连字符。确保将破折号复制并粘贴到替换调用中:)

关于python - 无法拆分看似已编码的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16104374/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com