gpt4 book ai didi

python - 在 python 中寻找 unicode 范围的补充

转载 作者:行者123 更新时间:2023-12-05 04:36:31 25 4
gpt4 key购买 nike

我有一组单词,我想找到那些包含非意大利语字符的单词。与其提供不属于意大利字母表的所有可能的 unicode 字母范围,我认为最好指定允许字母的范围,然后检查字符串是否包含不属于这些范围的任何字符。问题是,我不知道如何告诉 Python 的 re模块来查找这些字符,但我找不到任何有用的信息。

举个例子:小写拉丁字母的范围是u0061 - u007a ,所以如果我运行以下命令:

print(re.search("[\u0061-\u007a]", 'hello'))

我得到输出:<re.Match object; span=(0, 1), match='h'> , 正如预期的那样。

现在让我们在输入字符串中添加一个超出范围的字符,并将其设为Àhello。 .我想搜索提供范围之外的字符。我尝试在范围前添加“^”字符:

print(re.search("^[\u0061-\u007a]", 'Àhello'))

但我得到 None作为输出。我想避免按字符扫描每个字符串。可能吗?

最佳答案

^ 符号放在方括号内:

print(re.search("[^\u0061-\u007a]", 'Àhello'))

关于python - 在 python 中寻找 unicode 范围的补充,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70824773/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com