gpt4 book ai didi

hadoop - pig : how to create a categorical variable?

转载 作者:可可西里 更新时间:2023-11-01 16:44:02 26 4
gpt4 key购买 nike

我在大型数据集上使用 PIG 0.12,我需要创建一个分类变量,例如

FOREACH mydata GENERATE category = 1 IF condition1
category = 2 IF condition2
category = 3 IF condition3

该语法不起作用。在 Pig 中可以这样做吗?

谢谢!

最佳答案

根据病情的复杂程度,这里有一些解决办法:

bincond :

(condition ? value_if_true : value_if_false) 

case :

X = FOREACH A GENERATE f2, (
CASE f2 % 2
WHEN 0 THEN 'even'
WHEN 1 THEN 'odd'
END
);

udf :

FOREACH mydata GENERATE category_udf(field_2b_checked)

关于hadoop - pig : how to create a categorical variable?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38076809/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com