gpt4 book ai didi

python - Python 正则表达式中的 UTF

转载 作者:太空狗 更新时间:2023-10-29 21:25:18 25 4
gpt4 key购买 nike

我知道 Python 3 修复了很多 UTF 问题,但是我不能使用 Python 3,我使用的是 2.5.1

我正在尝试对文档进行正则表达式处理,但文档中包含 UTF 连字符 - 而不是 -。 Python 无法匹配这些,如果我将它们放在正则表达式中,它会抛出一个不稳定的问题。

如何强制 Python 使用 UTF 字符串或以某种方式匹配这样的字符?

谢谢你的帮助

最佳答案

您必须对有问题的字符 (–) 进行转义,并在字符串文字前面放置一个 u 以使其成为 unicode 字符串。

所以,例如,这个:

re.compile("–") 

变成这样:

re.compile(u"\u2013")

关于python - Python 正则表达式中的 UTF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/372102/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com