gpt4 book ai didi

hadoop - 来自输入的 PigStorage 和变量模式

转载 作者:可可西里 更新时间:2023-11-01 16:26:22 25 4
gpt4 key购买 nike

我有一个逗号分隔的文本文件,例如

1,abc,1,
2,def,1,2,3,4
3,ghi,1,2
4,jkl,1,5,6,7,8,9
5,mno

文本文件将始终具有前两个值,但在第二个逗号之后将具有 0 个或多个值。

如何加载此数据并为前两个值指定别名?

我可以加载它而不是通过以下方式为前两个值提供别名:

A = LOAD 'data.txt' USING PigStorage(',');

从这里开始,我可以执行 B = FOREACH A GENERATE $0 AS foo:chararray, $1 AS bar:chararray; 但它会丢弃其余部分。做一个通配符并将其余的放在一个元组中会很好。

有什么办法吗?

最佳答案

试试这个

B = foreach A generate $0 as foo:chararray, $1 as bar:chararray, $2..;

引用

Drop single column in Pig

关于hadoop - 来自输入的 PigStorage 和变量模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22547970/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com