gpt4 book ai didi

regex - 在 Hive 中使用 regexp_extract

转载 作者:行者123 更新时间:2023-12-02 03:43:36 25 4
gpt4 key购买 nike

我正在尝试从配置单元表中查找行,其中特定列不包含空值或\N 值或 STX 字符“\002”。目标是找到哪些行包含这三个以外的一些字符。

我尝试了这个配置单元查询:

    select column1,length(regexp_replace(column1,'\N|\002|NULL','')) as value         
FROM table1 LIMIT 10;

我原以为在以下情况下为零,但我得到了以下信息:

    column1 value
NULL NULL
0
NULL NULL
0
\N\N\N\N\N\N\N\N 8
NULL NULL
\N\N\N\N\N\N\N\N 8
NULL NULL
NULL NULL
\N\N\N 3

有人可以帮我解决上述情况的正确正则表达式吗?

谢谢。

拉维

最佳答案

看起来 Hive 使用的是 Java 的正则表达式引擎,所以问题似乎出在正则表达式本身,更具体地说是在转义序列中。

尝试以下方法,如果不起作用,请告诉我:

(?:(?:\\\\N)+|\002|NULL)

关于regex - 在 Hive 中使用 regexp_extract,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18575589/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com