gpt4 book ai didi

java - PIG - 我可以将 byteArray 转换为元组吗

转载 作者:可可西里 更新时间:2023-11-01 15:17:07 25 4
gpt4 key购买 nike

我正在处理一个序列文件。序列文件中的每条记录都是一个protobuf。

在 PIG 中,我使用 elephantbird 的 SequenceFileLoader 和 ProtoBuf 转换器加载序列文件。

所以,现在我可以看到一个代表 protobuf 对象的元组。比方说:

objects: {object: {id: long, name: chararray, nested-object: bytearray}....}.

嵌套对象是另一个具有两个属性(prop1、prop2)的 protobuf。

现在,有人可以帮我弄清楚如何将嵌套对象的字节数组转换为另一个元组 (prop1, prop2)(不确定元组是否是正确的术语)?

最佳答案

不确定这是否是最好的方法,但我通过按照这些 instructions 编写一个 UDF 解决了这个问题。 .

我的 UDF 将采用 DataByteArray 并返回一个元组。

然后在 Pig 中:

nestedObjects = FOREACH objects GENERATE MY_UDF_CONVERTER(nested_object);

关于java - PIG - 我可以将 byteArray 转换为元组吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18516265/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com