作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有两个数据集:
A = {uid, url}; B = {uid, url};
现在我做一个cogroup
:
C = COGROUP A BY uid, B BY uid;
我想将 C 更改为 {group AS uid, DISTINCT A.url+B.url
};
我的问题是如何连接两个包 A.url 和 B.url?
或者换句话说,如何在多个列上执行 DISTINCT
?
最佳答案
这不可能是您所期望的,但这是我从您的问题中了解到的:
C = JOIN A BY uid, B BY uid;
D = DISTINCT C;
连接是通过以下方式完成的:
E = FOREACH D GENERATE CONCAT(A::uid,B::uid);
关于apache-pig - 如何在拉丁 pig 中组合/连接两个袋子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10661389/
我得到了这样的 Bag 类 import java.util.Iterator; import java.util.NoSuchElementException; public
我是一名优秀的程序员,十分优秀!