gpt4 book ai didi

hadoop - Pig 中的包和元组模式

转载 作者:可可西里 更新时间:2023-11-01 16:06:27 27 4
gpt4 key购买 nike

我试图为我尝试使用 JsonLoader 加载的一些数据指定模式,我要上传的数据的格式为

Features:["Speedy","New","Automatic",..]

对于每条记录,特征的数量不是固定的,它可以不同。我在模式中将其表示为:

Features: bag{a: tuple(t:chararray)}

但是它不起作用。有人可以用正确的语法帮助我并指出我错在哪里吗?

最佳答案

字段名称规范是不必要的,因为您有没有任何字段名称的简单数组。试试这个:

a = load 'a.json' using JsonLoader('value:int,feature:{(chararray)}');

Json文件:

{"value":1, "feature":[1, 2, 3] }
{"value":2, "feature":[2,3,4]}
{"value":3, "feature":[12,13,14]}
{"value":4, "feature":[2]}

输出:

(1,{(1),(2),(3)})
(2,{(2),(3),(4)})
(3,{(12),(13),(14)})
(4,{(2)})

关于hadoop - Pig 中的包和元组模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36375818/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com