gpt4 book ai didi

hadoop - 在 Hadoop/Pig 中使用匹配进行过滤

转载 作者:可可西里 更新时间:2023-11-01 16:24:52 26 4
gpt4 key购买 nike

我正在尝试学习 Hadoop/Pig 并一直在 AWS 上工作,

日期看起来像这样(每列包含各种网站):

 <http://openean.kaufkauf.net/id/businessentities/GLN_7654990000088> 
<http://www.w3.org/2000/01/rdf-schema#isDefinedBy>
<http://openean.kaufkauf.net/id/businessentities/>
<http://openean.kaufkauf.net/id/businessentities/GLN_6406510000068> .

我正在尝试过滤其中包含“业务”的行,但过滤器一直返回 0 条记录。 my_data 的格式如上所示,有 3 列,第一列是上面显示的主题以及我要过滤的内容。我有:

filter1 = FILTER my_data BY subject=='.*business.*';

不确定为什么这没有返回任何内容,因为“业务”肯定在其中 3 个记录中。

最佳答案

试试这个

filter1 = FILTER my_data BY (subject matches '.* business.*');

关于hadoop - 在 Hadoop/Pig 中使用匹配进行过滤,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39839245/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com