hadoop - pig :FLATTEN keyword-6ren

hadoop - pig :FLATTEN keyword

转载作者：可可西里更新时间：2023-11-01 14:26:43

28

4

我对在 PIG 中使用 FLATTEN 关键字有点困惑。

考虑以下数据集:

tuple_record: {details: (firstname: chararray,lastname: chararray,age: int,sex: chararray)}

在不使用 FLATTEN 的情况下，我可以像这样访问一个字段(假设是名字):

display_firstname = FOREACH tuple_record GENERATE details.firstname;

现在，使用 FLATTEN 关键字:

flatten_record = FOREACH tuple_record GENERATE FLATTEN(details);

DESCRIBE 给我这个:

flatten_record: {details::firstname: chararray,details::lastname: chararray,details::age: int,details::sex: chararray}

因此我可以直接访问存在的字段而无需像这样取消引用:

display_record = FOREACH flatten_record GENERATE firstname;

我与此 FLATTEN 关键字相关的问题是:

1) 在这两种方式中，哪种方式(即使用或不使用 FLATTEN)是实现相同输出的优化方式？

2)有什么特殊场景不使用FLATTEN关键字，无法达到预期的输出？

完全糊涂了；请说明它的用途以及我将在哪些情况下使用它。

最佳答案

有时您的包或元组中有数据，您想要移除该层级的嵌套。
当您想动态切换数据并按特定字段分组时，您需要一种方法将这些条目从包中提取出来。

根据 Pig 文档:

The FLATTEN operator looks like a UDF syntactically, but it is actually an operator that changes the structure of tuples and bags in a way that a UDF cannot. Flatten un-nests tuples as well as bags. The idea is the same, but the operation and result is different for each type of structure.

更多详情请查看this link他们已经用例子清楚地解释了FLATTEN的用法

关于hadoop - pig :FLATTEN keyword，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28290030/

28

4

0

文章推荐： apache - hadoop 作业列表已弃用

文章推荐： firefox - 在浏览器中打开 HDFS 文件

文章推荐： hadoop - Hadoop 的 HDFS 高可用性特性如何影响 CAP 定理？

文章推荐： hadoop - 处于不健康状态的节点管理器

python - Python代码返回: Syntaxerror non-keyword after keyword arg
import csv import numpy as np from sklearn.svm import SVR import matplotlib.pyplot as plt dates = []
parsing - 是否有可能有一个语法，其中 "keyword"也可以被视为 "non-keyword"？
我在 ANTLRWorks 1.4 中有以下语法。我正在考虑在文本冒险游戏创建器中实现解析器的想法，其中用户将为他的游戏指定各种允许的命令。 grammar test; parse :
python - 没有明显原因的语法错误 : non-keyword arg after keyword arg,
我有一个 .dat 文件，我首先想将其转换为 .csv 文件，然后根据时间绘制一些行，我的脚本如下: import pandas as pd import numpy as np from sys i
python 出现SyntaxError: non-keyword arg after keyword arg错误解决办法
python 出现SyntaxError: non-keyword arg after keyword arg错误解决办法前言：
python - Tkinter-SyntaxError : non-keyword arg after keyword arg
我有一个我无法理解的问题，因此在删除按钮中，尝试在创建按钮后将其删除的地方，出现以下错误: Delete=Button(root,text='Delete',command=lambda : S.pa
python : threads; SyntaxError: non-keyword arg after keyword arg
我想将某个函数作为线程运行，但我得到了 SyntaxError: non-keyword arg after keyword arg 我不明白为什么: #!/usr/bin/env python im
python - 尝试用Python制作一个递归爬行蜘蛛。语法错误: non-keyword arg after keyword arg
我试图在 scrappy 中抓取多个页面，我的函数确实返回第一个起始网址，但我无法设法使蜘蛛的规则生效。这是我到目前为止所拥有的: import scrapy from scrapy.contrib
正则表达式 : Keep text between 2 keywords but only if another keyword exists inside them
我正在使用 emeditor，我试图从法语维基百科转储 .xml 文件(20GB，3.38 亿行，总共 480 万篇文章)中分离出大约 200 万篇包含 keyword3 的文章。我想将文本包含在 2
mysql - 在 MySQL : selecting publications on keyword but including all keywords in results
发布表如下所示: publications ============ id title etc ... 关键字表如下所示: keywords ======== id name etc ... keyw
python - 语法错误 : non-keyword arg after keyword arg in arguments function
我有这个功能: def crypting(self, client, access_token, client_id, client_secret, oauth_scope, redirect_uri
ruby-on-rails - 错误 : "unexpected keyword else, expected keyword end"?
我正在学习 Rails，但在以下代码中出现语法错误 unexpected keyword else, expected keyword end，我不知道为什么。
javascript - 如何使用 Iron Router 获取 domain.com/keyword 中的 'keyword'
我正在一个网站上工作，我必须在数据库中搜索根域上/之后的字符串。我在文档中找不到任何有关它的信息。我正在尝试使其与 Iron Router 一起使用，但任何其他建议都会起作用。感谢您的帮助! 编辑:
tomcat - 用 q=* :* && q={keyword} && q=field:{keyword} in solr 4. 9 查询
我刚刚找到有关 apache solr 的信息，并且在我成功安装了带有 Tomcat 的 apache Solr 之后。然后我开始使用 Apache Solr 进行搜索。但我对 Apache Sol
javascript - 当我们在 ng-model 中使用 "keyword.name"以及在过滤器中使用 "filter: keyword"时，我无法弄清楚过滤器将如何工作
我是 Angular JS 新手。我无法弄清楚过滤器如何仅对对象中的名称起作用，而不是对对象中的电话键起作用。就好像我们在 ng-model 中仅使用关键字一样，它将过滤范围中定义的对象中的名称和电话
python - "SyntaxError: non-keyword arg after keyword arg"尝试将函数绑定(bind)到 tkinter 中的按钮时
当我运行以下代码行时，我试图将按钮按下绑定(bind)到 Tkinter 中的函数 get = Button(root, lambda: ChangeColour(boxes[1][2], boxes
python - "SyntaxError: non-keyword arg after keyword arg"Python 在使用 requests.post() 时出错
response = requests.post("http://api.bf3stats.com/pc/player/", data = player, opt) 在 python IDLE 中运行
java - 如何更新 Dynamo DB 中保留关键字的值。错误: Attribute name is a reserved keyword; reserved keyword: data
这是我正在操作的更新查询。此处错误“set data = :updateValue”，数据是 Dynamo DB 的保留关键字。我想我应该在这里使用 update ExpressionAttribut
operator-keyword - 猫王算子词源
根据维基百科，二元运算符 ?:是 colloquially referred to as the Elvis operator due to its resemblance to an emotico
keyword - Forth 中的逻辑与？
我知道 AND 词定义了二进制 and ...但什么定义了逻辑and ? 最佳答案同一个字，AND , 也用于逻辑与。但是这两个输入值要AND推荐为格式良好的标志 ; 真和假由两个值表示，位全部
operator-keyword - 反引号运算符的固定性？
反引号运算符的固定性是什么？例如在 Real World Haskell 的这段代码中: ghci> (1+) `fmap` [1,2,3] ++ [4,5,6] [2,3,4,4,5,6] 很明显

首页

博学

6Ren·AI

商城

hadoop - pig :FLATTEN keyword