gpt4 book ai didi

hadoop - 如何在Pig中使用自定义加载程序功能返回多个元组

转载 作者:行者123 更新时间:2023-12-02 21:34:45 24 4
gpt4 key购买 nike

我已经通过实现LoadFunc类编写了自定义加载器函数。

现在,我想返回多行作为getNext()方法中的输入。

我已经使用了像

databag.add(tuple1);
databag.add(tuple2);

然后
tuple3.set(0,databag);

并在getNext()方法中返回tuple3。

但是我有一个错误
org.apache.pig.backend.executionengine.ExecException: ERROR 1071: Cannot convert a bag to a String

您能否指导如何进行,如果方法不正确,则如何解决此问题。

谢谢,欢呼:))

最佳答案

如果您想要一个带有多个元组的袋子。那么这将是一种生成它的方法。首先生成(设置)元组,然后将这些元组添加到数据袋中。

BagFactory bf=BagFactory.getInstance();
DataBag output=bf.newDefaultBag();
...
TupleFactory tp=TupleFactory.getInstance();
Tuple t1=tp.newTuple(2);
....
t1.set(0,key_out);
t1.set(1,value_out);
output.add(t1);
return output;

关于hadoop - 如何在Pig中使用自定义加载程序功能返回多个元组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33120446/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com