- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我是 Apache Pig 的新手,正在尝试学习。 Apache Pig 中是否有等效于 SQL 的 COUNT(DISTINCT CASE WHEN ...)
?
例如,我正在尝试做这样的事情:
CREATE TABLE email_profile AS
SELECT user_id
, COUNT(DISTINCT CASE WHEN email_code = 'C' THEN message_id ELSE NULL END) AS clickthroughs
, COUNT(DISTINCT CASE WHEN email_code = 'O' THEN message_id ELSE NULL END) AS opened_messages
, COUNT(DISTINCT message_id) AS total_messages_received
FROM email_campaigns
GROUP BY user_id;
我不能使用 FILTER email_campaigns BY email_code = 'C'
,因为那样会减少其他情况。有没有办法在一个嵌套的 FOREACH
block 中完成这一切?
谢谢!
编辑:
根据要求,示例数据。字段是 used_id
、email_code
和 message_id
。
user1@example.com O 111
user1@example.com C 111
user2@example.com O 111
user1@example.com O 222
user2@example.com O 333
预期输出:
user1@example.com 2 1 2
user2@example.com 2 0 2
最佳答案
您可以在 nested FOREACH
中进行过滤在你之后GROUP
在 used_id
上。有关详细信息,请参阅我的代码中的注释。
类似于:
-- Firstly we group so the FOREACH is applied per used_id
A = GROUP email_campaigns BY used_id ;
B = FOREACH A {
-- We need these three lines to accomplish the:
-- DISTINCT CASE WHEN email_code = 'C' THEN message_id ELSE NULL END
-- First, we get only cases where email_code == 'C'
click_filt = FILTER email_campaigns BY email_code == 'C' ;
-- Since we only want unique message_ids, we need to project it out
click_proj = FOREACH click_filt GENERATE message_id ;
-- Now we can find all unique message_ids for a given filter
click_dist = DISTINCT click_proj ;
opened_filt = FILTER email_campaigns BY email_code == 'O' ;
opened_proj = FOREACH opened_filt GENERATE message_id ;
opened_dist = DISTINCT opened_proj ;
total_proj = FOREACH email_campaigns GENERATE message_id ;
total_dist = DISTINCT total_proj ;
GENERATE group AS used_id, COUNT(click_dist) AS clickthroughs,
COUNT(opened_dist) AS opened_messages,
COUNT(total_dist) AS total_messages_received ;
}
B
的输出应该是:
(user1@example.com,1,2,2)
(user2@example.com,0,2,2)
如果您需要任何关于正在发生的事情的额外说明,请告诉我。
关于sql - Apache Pig 中是否有等同于多个 COUNT(DISTINCT CASE WHEN ...) 语句的语句?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19432597/
创建一个“海盗对话”,可以选择左手或右手。我希望它对“左”和“右”的不同拼写做出积极的回答(正如您将在代码中看到的那样),但是,当我为所有非“右”或“左”的输入添加最终的“else”代码时,它给了我一
With 语句 对一个对象执行一系列的语句。 With object statements End With 参数 object 必需的部分
While...Wend 语句 当指定的条件为 True 时,执行一系列的语句。 While condition  ; Version [stat
所以我正在处理的代码有一个小问题。 while True: r = input("Line: ") n = r.split() if r == " ":
我有一个对象数组: var contacts = [ { "firstName": "Akira", "lastName": "Laine", "number"
int main() { int f=fun(); ... } int fun() { return 1; return 2; } 在上面的程序中,当从main函数中调用一个
我的项目中有很多 if 语句、嵌套 if 语句和 if-else 语句,我正在考虑将它们更改为 switch 语句。其中一些将具有嵌套的 switch 语句。我知道就编译而言,switch 语句通常更
Rem 语句 包含程序中的解释性注释。 Rem comment 或 ' comment comment 参数是需要包含的注释文本。在 Rem 关键字和 comment 之间应有一个空格。
ReDim 语句 在过程级中声明动态数组变量并分配或重新分配存储空间。 ReDim [Preserve] varname(subscripts) [, varname(subscripts)]
Randomize 语句 初始化随机数生成器。 Randomize [number] number 参数可以是任何有效的数值表达式。 说明 Randomize 使用 number 参数初始
Public 语句 定义公有变量并分配存储空间。在 Class 块中定义私有变量。 Public varname[([subscripts])][, varname[([subscripts])
Sub 语句 声明 Sub 过程的名称、参数以及构成其主体的代码。 [Public [Default]| Private] Sub name [( arglist )]
Set 语句 将对象引用赋给一个variable或property,或者将对象引用与事件关联。 Set objectvar = {objectexpression | New classname
我有这个代码块,有时第一个 if 语句先运行,有时第二个 if 语句先运行。我不确定为什么会这样,因为我认为 javascript 是同步的。 for (let i = 0; i < dataObje
这是一个 javascript 代码,我想把它写成这样:如果此人回答是,则回复“那很酷”,如果此人回答否,则回复“我会让你开心”,如果此人回答的问题包含"is"或“否”,请说“仅键入”是或否,没有任何
这是我的任务,我尝试仅使用简短的 if 语句来完成此任务,我得到的唯一错误是使用“(0.5<=ratio<2 )”,除此之外,构造正确吗? Scanner scn = new Scanner(
有没有办法在 select 语句中使用 if 语句? 我不能在这个中使用 Case 语句。实际上我正在使用 iReport 并且我有一个参数。我想要做的是,如果用户没有输入某个参数,它将选择所有实例。
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: If vs. Switch Speed 我将以 C++ 为例,但我要问的问题不是针对特定语言的。我的意思是一
Property Set 语句 在 Class 块中,声明名称、参数和代码,这些构成了将引用设置到对象的 Property 过程的主体。 [Public | Private] Pro
Property Let 语句 在 Class 块中,声明名称、参数和代码等,它们构成了赋值(设置)的 Property 过程的主体。 [Public | Private] Prop
我是一名优秀的程序员,十分优秀!