gpt4 book ai didi

Hive 中的 regexp_extract 参数

转载 作者:可可西里 更新时间:2023-11-01 16:06:38 24 4
gpt4 key购买 nike

花括号中的参数在下面的代码段中有什么作用?

regexp_extract(col_value, '^(?:([^,]*)\,?){1}', 1) Id,  
regexp_extract(col_value, '^(?:([^,]*)\,?){2}', 1) Score,
regexp_extract(col_value, '^(?:([^,]*)\,?){9}', 1) DisplayName,

最佳答案

如您所见here ,大括号包含前面标记的次数,在本例中为 non-capturing group , 可能会重复。

该组包含一个(可能为空)capturing group由非逗号字符组成,后跟一个可选的逗号。由于大括号中只有一个数字,因此非捕获组必须准确地重复该次数。

我不知道为什么要用反斜杠转义逗号。在我看来,反斜杠是不必要的。

警告:我不知道 Hadoop 或 Hive,我对 regexp_extract 的所有了解都来自 this page .

这些正则表达式的目的是匹配逗号分隔列表中的第一个、第二个和第九个元素,其中捕获组 #1(由 regexp_extract 的第三个参数选择)仅返回其最后一次出现。当然逗号并不是真正可选的,除了在最后一个元素之后。

关于Hive 中的 regexp_extract 参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36108214/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com