gpt4 book ai didi

regex - 用于域提取的 Redshift 正则表达式

转载 作者:行者123 更新时间:2023-12-01 13:44:46 24 4
gpt4 key购买 nike

我正在尝试为 REGEXP_SUBSTR (Redshift) 形成一个正则表达式这将从任何给定的 URL 中提取子域和域部分。

我尝试了来自 stackoverflow 的许多建议:regular-expression-extract-subdomain-domain、getting-parts-of-a-url-regex、how-to-get-domain-name-from-url 等。其中一些正在处理regex 验证器,但不适用于 Redshift。

正则表达式应该处理带有和不带有 http/https 前缀的 URL。

有没有其他方法可以使用正则表达式从任何给定的 URL 中提取子域和域?

最佳答案

经过 实验中,这就是我使用的:

REPLACE(REGEXP_SUBSTR(url,'//[^/\\\,=@\\+]+\\.[^/:;,\\\\\(\\)]+'),'//','')

需要匹配双斜线,然后用 REPLACE 删除它因为 Redshift 支持非常基本的正则表达式。

FWIW,您会注意到这与 Jeff Barr 在 Redshift UDF's intro 中提供的正则表达式非常不同。 - 正则表达式产生 没什么为了我。

关于regex - 用于域提取的 Redshift 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36834716/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com