作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在用以下句子从 hive 中的日志中提取信息:
regexp_extract(values, "^(\\w{3} \\s?\\d+ \\d\\d:\\d\\d:\\d\\d \\w+-\\w+ \\w+:) (\\[)(\\d{2})(\\/)(\\w{3})(\\/)(\\d{4})(.*\\])",3)day,
regexp_extract(values, "^(\\w{3} \\s?\\d+ \\d\\d:\\d\\d:\\d\\d \\w+-\\w+ \\w+:) (\\[)(\\d{2})(\\/)(\\w{3})(\\/)(\\d{4})(.*\\])",5)month
最佳答案
也许不完全是您要查找的内容,但是如果您确实想要一种提取方法,而不是一种提取方法,那么将为您提供多个字段,这就是我的发现:
http://dev.bizo.com/2012/01/using-genericudfs-to-return-multiple.html
请注意,对于此解决方案,您需要编写带有对象检查器的UDF,但请亲自看看。
关于regex - hive 中的功能regex_extract,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28498345/
我有字符串列,我想要第一个分号后的数据 列数据:Options;list:direct & ACFs:Sharemarket 我希望输出为 list:direct & ACFs:股票市场 我试过这个选
我想从每个字段的开头和结尾删除双引号 '"'。我正在尝试在 pig 身上应用正则表达式,但似乎不起作用 输入: (main_170521230001.csv,"9","2017-05-21 23:00
我尝试从 BigQuery 中的 #1 中提取 #2 REGEXP_EXTRACT(",\"AQk8tmAg94ZUZwqYKd6kHrswiVZR0wKNuTvSpr6COCLpki\"", r"(
我是一名优秀的程序员,十分优秀!