gpt4 book ai didi

regex - hive 中的功能regex_extract

转载 作者:行者123 更新时间:2023-12-02 21:41:20 25 4
gpt4 key购买 nike

我正在用以下句子从 hive 中的日志中提取信息:

regexp_extract(values, "^(\\w{3} \\s?\\d+ \\d\\d:\\d\\d:\\d\\d \\w+-\\w+ \\w+:) (\\[)(\\d{2})(\\/)(\\w{3})(\\/)(\\d{4})(.*\\])",3)day, 
regexp_extract(values, "^(\\w{3} \\s?\\d+ \\d\\d:\\d\\d:\\d\\d \\w+-\\w+ \\w+:) (\\[)(\\d{2})(\\/)(\\w{3})(\\/)(\\d{4})(.*\\])",5)month

我使用相同的正则表达式在两个不同的regex_extract调用中提取两个字段。是否可以仅执行一次regex_extract提取多个字段?

最佳答案

也许不完全是您要查找的内容,但是如果您确实想要一种提取方法,而不是一种提取方法,那么将为您提供多个字段,这就是我的发现:

http://dev.bizo.com/2012/01/using-genericudfs-to-return-multiple.html

请注意,对于此解决方案,您需要编写带有对象检查器的UDF,但请亲自看看。

关于regex - hive 中的功能regex_extract,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28498345/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com