gpt4 book ai didi

python - 在 Python 中使用正则表达式匹配区分大小写的 unicode 字符串

转载 作者:太空狗 更新时间:2023-10-29 23:55:49 24 4
gpt4 key购买 nike

假设我想匹配一个小写字母后跟一个大写字母,我可以做类似的事情

re.compile(r"[a-z][A-Z]")

现在我想对 unicode 字符串做同样的事情,即匹配 'aÅ' 或 'yÜ' 之类的东西。

尝试过

re.compile(r"[a-z][A-Z]", re.UNICODE)

但这不起作用。

有什么线索吗?

最佳答案

使用 Python 正则表达式很难做到这一点,因为当前的实现不支持 Unicode 属性快捷方式,例如 \p{Lu}\p{Ll}

[A-Za-z] 当然只会匹配 ASCII 字母,无论是否设置了 Unicode 选项。

因此,在 re 模块更新之前(或者您安装了目前正在开发中的 regex package),您要么需要以编程方式进行(遍历字符串并执行 char.islower ()/char.isupper() 在字符上),或手动指定所有 unicode 代码点,这可能不值得付出努力...

关于python - 在 Python 中使用正则表达式匹配区分大小写的 unicode 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7397879/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com