gpt4 book ai didi

apache-pig - 如何在拉丁 pig 中组合/连接两个袋子

转载 作者:行者123 更新时间:2023-12-03 12:35:26 24 4
gpt4 key购买 nike

我有两个数据集:

A = {uid, url}; B = {uid, url};

现在我做一个cogroup:

C = COGROUP A BY uid, B BY uid;

我想将 C 更改为 {group AS uid, DISTINCT A.url+B.url};

我的问题是如何连接两个包 A.url 和 B.url?

或者换句话说,如何在多个列上执行 DISTINCT

最佳答案

这不可能是您所期望的,但这是我从您的问题中了解到的:

C = JOIN A BY uid, B BY uid;
D = DISTINCT C;

连接是通过以下方式完成的:

E = FOREACH D GENERATE CONCAT(A::uid,B::uid); 

关于apache-pig - 如何在拉丁 pig 中组合/连接两个袋子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10661389/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com