gpt4 book ai didi

hadoop - Pig 过滤掉不匹配项

转载 作者:可可西里 更新时间:2023-11-01 14:20:28 26 4
gpt4 key购买 nike

我有一堆具有各种前缀的字符串,包括“未知:”我真的很想在我的 Pig 脚本中过滤掉所有以“未知:”开头的字符串,但它似乎不起作用。

simpleFilter = FILTER records BY NOT(mystr MATCHES '^unknown');

我已经尝试了正则表达式的一些其他排列,但似乎 MATCHES 不能很好地与 NOT 一起工作。我错过了什么吗?

使用 Pig 0.9.2

最佳答案

这是因为 matches 运算符的操作与 Java 的 String#matches 完全相同,即它试图匹配整个 String 而不仅仅是它的一部分(你的例子中的前缀).只需更新您的正则表达式以匹配具有您指定前缀的整个字符串,如下所示:

simpleFilter = FILTER records BY NOT(mystr MATCHES '^unknown.*');

关于hadoop - Pig 过滤掉不匹配项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16725275/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com