gpt4 book ai didi

php - 如何根据正则表达式格式化字符串?

转载 作者:行者123 更新时间:2023-12-04 13:52:56 24 4
gpt4 key购买 nike

我正在编写一个 PHP 应用程序,它从 API 获取数据(我们称之为 A )并写入另一个(我称之为 B )。我在一个特定的领域苦苦挣扎:邮政编码。

API 一个 将所有邮政编码作为 7 位字符串返回,不带任何分隔符。如果特定邮政编码的位数少于 7 位,则使用 0 填充该值。 (零)向左。这样,50-224 – 来自波兰的邮政编码 – 变为 0050224 .我无法控制此输出,并且可能以这种方式存储。我知道这是一个波兰邮政编码,因为回复还给了我国家/地区代码 PL .

问题在于 API 验证邮政编码并要求正确的格式。

我找到了 PHP library on GitHub具有每个国家/地区邮政编码格式的正则表达式。像这样:resources/address_format/PL.json .

我想要做的是使用该库提供的表达式来格式化 返回的值一个 .

我当前的代码如下所示:

use CommerceGuys\Addressing\Repository\AddressFormatRepository;

$country = 'US';
$postalcode = '0031401';
$repo = new AddressFormatRepository();
$pattern = $repo
->get($country)
->getPostalCodePattern()
;
$postalcode = preg_replace(
'/^.*(' . $pattern . ')$/',
'$1',
$potalcode
);

对于上述情况,美国邮政编码,它可以正常工作,因为代码的第二部分在表达式中是可选的: (\d{5})(?:[ \-](\d{4}))? .当其他国家出现时,我开始遇到问题,特别是在邮政编码包含字母和数字以外的其他字符的情况下。

顺便说一句,我在 S.O. 上查看了几个问题,但是,他们似乎都没有询问我想要实现的目标。

更新

尽管上面是波兰语示例,但我的代码应该适用于任何国家/地区。我只是想提供一些关于我正在尝试做的事情的背景。正如我在问题标题中所说,我希望利用寻址库中的正则表达式。

来自其他国家的更多示例:
Country | Postal code
--------+------------
PH | 0002010
LB | 0001201
JO | 0000962

最佳答案

您可以从正则表达式生成所有可能的组合。 Faker 例如,使用它的regexify格式化程序。

问题是有效的邮政编码是可能匹配的子集。例如,美国 5 位邮政编码正则表达式 (\d{5}) 产生 100,000 个候选者,但只有(大约)43,000 5 位邮政编码。

在我看来,这听起来像是 GIGO - Garbage In, Garbage Out 的经典案例。 .您将获得一个非规范化数据点,并要求您根据第一原则对其进行规范化。这很难。有时是不可能的。

如果我是你,我会从一个简单的格式列表开始,比如 this one (或 this one 如果原件离线)基于联合国列表。然后从您的输入中一次拉出一个字符,反向并匹配它。让我们举个例子。

API A 告诉你 0001201是利比里亚。从列表中,您可以看到利比里亚的格式是 9999 .反转这两个字符串:10210009999分别。现在一次走一个字符的格式,匹配。格式中的第一个字符是 9 ,这是一个数字占位符。反向输入的第一个字符是数字吗?是:1 ,记住这一点。好的,第二个角色。 90 ,零匹配所以记住它。重复直到我们用完格式或输入,或者我们在格式上遇到不匹配。

在此示例中,我们将在输入数字之前用完格式数字,并且我们不会遇到错误,发现反向输入 1021匹配反转格式 9999 .所以我们完成了,现在对比赛进行最后的反转:1021变成 1201 ,这是一个有效的利比里亚邮政编码。

关于php - 如何根据正则表达式格式化字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36946953/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com