- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我是 Hadoop PIG 的新手,我有一个如下所示的数据集:
region_id region participation score
1 SSA YES 10
1 SSA NO 22
2 MONTPELIER YES 15
....
我想计算每个地区的分数总和。我正在寻找的最终显示是:
REGION - SCORE,例如:
SSA - 32
我加载了我的数据:
data = load '/user/cloudera/datapi/pigdata.csv' using PigStorage (',') AS
(id:int, region:chararray, participation:chararray, score:int);
然后按地区对数据进行分组:
split_region = GROUP data by region;
最后:
RES= foreach split_region GENERATE SUM(data.score), data.region;
RES 变量包含每个区域的得分总和,但它显示该区域的所有出现情况,如下所示:
(32 , {SSA,SSA})
缺少的显示 (32, SSA)
的命令/指令是什么?
最佳答案
使用group
代替data.region
RES = foreach split_region GENERATE SUM(data.score), group;
参见 here对于来源。当您使用 GROUP 运算符时,第一个字段名为“group”(不要将其与 GROUP 运算符混淆)并且与组键的类型相同。
关于hadoop - 如何用拉丁 pig 按地区分组结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47355962/
我对UDF pig 拉丁有问题。 我正在尝试实现一个系统,该系统必须验证本地存储的矩阵与hadoop存储库中存储的一组矩阵之间是否存在“映射”。 对于映射,我的意思是在hadoop中是否存在一个存储矩
数据库的排序规则用法是什么?好吧,对于 HTML UTF-8,我知道一点,比如显示其他语言类型。但是对于数据库呢?我正在使用 latin-1(默认),我的 friend 告诉我改用 UTF。当我问为什
我有以下带有架构的数据 (t0: chararray,t1: int,t2: int) (B,4,2) (A,2,3) (A,3,2) (B,2,2) (A,1,2) (B,1,2) 我想生成以下结果
我正在尝试构建 AOSP 拉丁 IME(源代码:https://android.googlesource.com/platform/packages/inputmethods/LatinIME/+/m
我正在实现过滤器功能。我使用以下方法定义字符串是否适合查询: someString.IndexOf(someSearch, StringComparison.OrdinalIgnoreCase) >=
我是一名优秀的程序员,十分优秀!