gpt4 book ai didi

正则表达式匹配所有 unicode 引号

转载 作者:行者123 更新时间:2023-12-05 08:44:44 27 4
gpt4 key购买 nike

是否有一个简单的正则表达式来匹配所有 unicode 引号?还是必须像这样手动编码:

quotes = ur"[\"'\u2018\u2019\u201c\u201d]"

感谢阅读。

布莱恩

最佳答案

Python 不支持 Unicode 属性,因此您不能使用 PiPf 属性,所以我想您的解决方案已经很好了。

您可能还想考虑不幸被使用的“假引号”——尖锐和重音符(´ 和 `` ):\u0060\u00B4`。

然后是 guillemets (« » ‹ ›),您也想要吗?对这些使用 \u00BB\u203A\u00AB\u2039

此外,您的命令有一个小错误:您将反斜杠添加到 quotes 字符串(因为您使用的是原始字符串)。请改用三引号字符串。

>>> quotes = ur"[\"'\u2018\u2019\u201c\u201d\u0060\u00b4]"
>>> "\\" in quotes
True
>>> quotes
u'[\\"\'\u2018\u2019\u201c\u201d`\xb4]'
>>> quotes = ur"""["'\u2018\u2019\u201c\u201d\u0060\u00b4]"""
>>> "\\" in quotes
False
>>> quotes
u'["\'\u2018\u2019\u201c\u201d`\xb4]'

关于正则表达式匹配所有 unicode 引号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3128890/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com