gpt4 book ai didi

python - 正则表达式工作错误,匹配意外内容

转载 作者:行者123 更新时间:2023-12-01 05:05:11 24 4
gpt4 key购买 nike

我有这个正则表达式:

[\(\+\[]?[0-9]([\-\)\.\/-\]]?\s?\(?[0-9\s\)]){8,20}?


它只能匹配电话号码,但也可以匹配以下内容:

[95.86.22.137]
95.86.22.137
(192.168.1.94)
274.1363525390625px;">
2014-8-720:32:45


有人可以帮我更正此正则表达式吗?

最佳答案

如果您确实想正确执行此操作,那么我将重新开始并首先建立您要匹配的模式,这在您的正则表达式中并不明显,也不在您的问题中,只是您不想要的。您需要将其视为“我想要什么?”,而不是“我要排除什么?”。做为“我想要什么?”您所需要的将消除所有这些讨厌的其他可能性。

您必须首先决定将接受什么作为“有效电话号码”。请记住,即使在NANP(北美编号计划)中,也有几种不同的格式,例如:


XXX-XXX-XXXX或
XXX XXX-XXXX或
1-XXX-XXX-XXXX或
(XXX)XXX-XXXX或
+(XXX)XXX-XXXX或
1(XXX)XXX-XXXX


而且所有这些都是有效数字,因此您必须确定要接受的格式。然后,在世界各地都有不同的格式,长度从9位(葡萄牙)到13位(韩国)数字,包括国家和国际代码。因此,您必须决定:


您会只接受NANP号码还是该标准以外的其他号码?
您会接受“ +”还是让他们编写国际代码?如果您需要输入密码,您要输入的国家/地区的代码是否会设置位数?如果他们输入代码,您的正则表达式将能够处理(如果接受)或发出红旗(如果不能接受)?
您会在区号周围强制使用括号,还是简单地允许它们(使括号为可选),还是完全拒绝它们?


最后一点,请注意,不同国家/地区的数字在不同的地方都有括号,即墨西哥有两位数字的区号(而不是NANP,顺便说一句)。

记住,每次做出这样的决定时,某个地方需要一个字符,就等于否定其他可能的有效电话号码,除非您也允许该插槽中的其他有效字符。这就是为什么没有一种合适的解决方案可以解决您的问题。出于这个原因,许多人会告诉您只删除“ +”,“(”,“)”,“-”,然后计算数字。但是,如果您认为需要在NANP数字中输入“ 1”,但是却没有人将其包含在内(因为该数字在NANP中通常是可选的),或者当不同国家/地区的数字中数字的位数不同时,此操作将失败。他们自己的国家,例如新西兰。

有所谓的综合指南:A comprehensive regex for phone number validation

但是我发现它非常缺乏处理诸如如何使人输入“ +”与“ 1”以及空格(用于NANP数字),如何强制括号,连字符等问题的方法。它为您提供了正则表达式,而不是说明如何到达那里。因此,我在这里的“博客”寻求答案。

以下是我将接受的严格的NANP正则表达式:


+(XXX)XXX-XXXX
1(XXX)XXX-XXXX
(XXX)XXX-XXXX


它需要括号和连字符,我认为,对于NANP数,它具有很大的灵活性,同时仍符合标准。幸运的是,我没有处理国际(NANP之外)的数字:

/^(\+|1\s)?[(][2-9]\d{2}[)][\s][2-9]\d{2}-\d{4}$/


/^ =单词开头的匹配项;基本上只是表示表达式的开始

(\ + | 1 \ s)?组


括号用于偏移组,并说内部的任何字符都是可选的,通过末尾的 ?并允许在内部使用“或”条件(请参见竖线字符)
\+ =转义的“ +”,以允许在加号上进行匹配(必须转义,因为它是正则表达式中的关键字符,请使用反斜杠)
| =竖线字符,也就是说它应与组中左侧或右侧的字符匹配
1\s =需要数字1和空格字符。 []不需要空间-尽管我看过其他帖子似乎表明确实需要空间,但这对我来说并不起作用。它是 \s


[(] =这是您指示需要左括号的方式。

[2-9] \ d {2}小组


[2-9] =这是为了使表达式匹配2-9位数字。这是因为在NANP中,区号开头(第一组3个数字)或电话交换机(第二组3个数字)中的0和1是无效号码。
\d{2} =这表示允许2位数,从0到9。这是 [0-9][0-9]的简写。


对于从000到999的三位数组,您只需说: \d{3}

[)] =这是您指示必须使用圆括号的方式。

[\s] =这将需要一个空格。

[2-9] \ d {2}-\ d {4}组


在连字符之前的第一部分与以前相同。
在此处设置连字符将需要它。如果您输入 -?,它将是可选的。
\d{4} =这表示允许从0到9的4位数字。这是 [0-9][0-9][0-9][0-9]的简写


$/ =表示匹配单词的结尾;基本上只是表示表达式的结尾。

希望这将帮助您建立自己的表达方式。

关于python - 正则表达式工作错误,匹配意外内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25184823/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com