gpt4 book ai didi

python - 无法使 python 的正则表达式忽略 unicode 字符串中的大小写

转载 作者:太空宇宙 更新时间:2023-11-03 13:47:25 24 4
gpt4 key购买 nike

不能使python的正则表达式忽略unicode字符串中的大小写。

mach = re.search(ur'(?P<mach>(?<=\s)%s(?=[\s\.]))' % u'смотреть', st, re.I | re.U)

在哪里

st = u" человека... Смотреть телесериал на тернет. "

注意到这个词 - Смотреть

我希望我的正则表达式能够找到这个词以及这个 смотреть

到目前为止:

print mach
> None

附言:现在每个人都可以开始减去我的问题了。它现在真的有效。即使从我的例子。但是,我花了半天时间来解决这个问题。

最佳答案

您正在为 st 使用字符串。这样它将 unicode 正则表达式与某个字节字符串匹配(取决于您的编码)。使用 unicode 字符串:

st = u" человека... Смотреть телесериал на тернет. "
print re.search(ur'(?P<match>(?<=\s)%s(?=[\s\.]))' % u'смотреть', st, re.I | re.U).groupdict()
# {u'match': u'\u0421\u043c\u043e\u0442\u0440\u0435\u0442\u044c'}

关于python - 无法使 python 的正则表达式忽略 unicode 字符串中的大小写,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16842463/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com