gpt4 book ai didi

hadoop - 如何根据给定格式在Pig中合并两行?

转载 作者:行者123 更新时间:2023-12-02 21:18:01 25 4
gpt4 key购买 nike

正在尝试处理文件。截至目前正在获得如下所示的输出。

input file:-
c=1,2,3
a,b,c,d,a
d,e,f
g,h,i,i
c=2,3,4
j,k,l
m,n,a,h
c=3,2,5
d,g,a
s,fs,a


expecting an output like:-
c=1,2,3,a,b,c,d,a
c=1,2,3,d,e,f
c=1,2,3,g,h,i,i
c=2,3,4,j,k,l
c=2,3,4,m,n,a,h
c=3,2,5,d,g,a
c=3,2,5,s,fs,a

还有其他方法可以得到类似的输出。
    Another output format:-
c=1,2,3,{(a,b,c,d,a),(d,e,f),(g,h,i,i)}
c=2,3,4,{(j,k,l),(m,n,a,h)}
c=3,2,5,{(d,g,a),(s,fs,a)}

有人可以帮我吗。我正在试着用 pig ,但是离这个还很遥远,我正在试着用 pig 来解决这个问题以获得一些实践。

感谢和问候,
安库什·雷迪

最佳答案

我认为 pig 不可能。 Pig是并行处理的,因此它不知道文件中的记录顺序。因此,我建议您先使用bash脚本或其他工具对其进行预处理,然后再使用Pig对其进行处理。

关于hadoop - 如何根据给定格式在Pig中合并两行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38233677/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com