hadoop - Apache Pig - 处理中间别名？-6ren

hadoop - Apache Pig - 处理中间别名？

转载作者：可可西里更新时间：2023-11-01 16:56:11

26

4

我正在编写一个包含许多操作的冗长的 Pig Latin 脚本。有时，操作的唯一目的是获得中间关系 X，该关系随后被转换或丰富为 Y，此时 X 不再是出于兴趣。 Pig 是否将 X 保持在某处(例如在内存或 HDFS 中)具体化，我是否应该担心“释放”X？或者这在 Pig 和 Hadoop 之间得到了处理？

奖励问题:如果在 MapReduce 上的 Pig、Tez 上的 Pig 和 Spark 上的 Pig 之间在运行时处理此类中间值时存在任何有趣的差异，那么也很高兴了解这一点。

最佳答案

Pig 使用惰性执行来评估。惰性求值的一些特征是

处理只发生在 DUMP/STORE 命令上
允许重新排序以进行优化
内存流水线

Pig 解释器会在您提交查询后计算 DAG。您可以在 grunt shell 中使用 EXPLAIN 命令查看 pig 使用的执行计划。

关于hadoop - Apache Pig - 处理中间别名？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29666586/

26

4

0

文章推荐： c# - 使用 HttpPost 注释？修复它不会破坏页面

文章推荐： android - 通过 MultipartEntity 发送 Unicode 字符

文章推荐： ios - 我怎么知道要使用哪个 NSURLRequest CachePolicy

文章推荐： java - 是否可以使用不同版本的 java 运行 jar 文件？

linux - 无法通过 LAN 从 Windows ping avahi 别名，但可以从其他 Linux VM ping avahi 别名
上下文:我已经在域根上设置了一个用于 GIS 测试和 dokuwiki 的虚拟机服务器。我想在子域上提供 gis Web 应用程序，这样 dokuwiki url 重命名就不会发生冲突(而且感觉更干净
Python 别名
这个问题在这里已经有了答案: If two variables point to the same object, why doesn't reassigning one variable affe
Mysql错误1066不唯一的表/别名
代码如下: Select Branch.BranchName, Sum(Inventory.OnHand) From Inventory, Branch Inventory.BranchNum = B
Javascript 别名
我的目标是创建一种“Javascript 库”，如果您可以这样调用它的话。我打算在浏览网页时使用它来操作页面，将其作为 greasemonkey 脚本动态加载。这个想法是将“win”映射到window
javascript变量引用/别名
是否可以在 javascript 中以某种方式为本地变量分配别名/引用？我的意思是类似 C 的东西: function foo() { var x = 1; var y = &x; y+
16、SQLite 别名
SQLite 别名您可以暂时把表或列重命名为另一个名字，这被称为别名。使用表别名是指在一个特定的 SQLite 语句中重命名表。重命名是临时的改变，在数据库中实际的表的名称不会改变。列别名用来
带点的 typescript 别名
我有以下导入(在同一个 TS 源文件中): import {Vector as sourceVector} from "ol/source"; import {Vector} from "ol/lay
Cmake add_library 别名
我想弄清楚 this 到底是什么行是在这个 github json 项目的 cmake 文件中， add_library(${NLOHMANN_JSON_TARGET_NAME} INTERFACE)
Magento，addAttributeToSelect，别名
使用集合时如何创建别名 (AS)。 $collection->addAttributeToSelect('total_qty') 可以这样做: $collection->getSelect()->co
带参数的 Git 别名
这个问题在这里已经有了答案: Pass an argument to a Git alias command (4 个回答) 去年关闭。我的团队在不同的分支上工作，通常，我需要快速从分支切换来帮助他
用于更改目录的 Vim 别名
我正在寻找一种向我的 vimrc 添加自定义命令或别名的方法，以便快速切换到 Vim 中的不同目录。我曾经设置过一些东西，但丢失了那个配置。这是用于 Linux 设置。基本上，我想设置一个别名(如果
delphi - Firebird 别名
我使用 Delphi 和 Firebird 1.5 开发了一个应用程序，其中服务器与应用程序位于同一台计算机上。我现在正在将应用程序部署到另一个站点，其中 Firebird 服务器( super 服务
javascript - 如何添加导入快捷方式 - 别名
我创建了一个全新的 React 应用 create-react-app demo 我需要为某些目录/组件创建别名，例如: import { Header } from '@uicomponents'
graphviz - DOT语言是否支持变量/别名？
我正在尝试打印有向图，并且不断更改各种节点属性，例如颜色和形状。有什么方法可以使用一次定义并用于多个节点的变量？理想情况下，我想要这样的东西: digraph g { building_color =
nginx 别名+位置指令
server { listen 80; server_name pwta; root html; location /test/{ alia
Javascript:匹配多个对象数组中的对象+别名
我想匹配多个数组，并在匹配时构建另一个数组。该键可以在任意数量的数组中匹配，也可以根本不匹配。 [ [{ 'a': 13 }, { 'b': 62 }, { 'c': 93 }, { 'd': 52
具有多个命令的 Git 别名
经过审查后，我需要更改一些代码并将所有更改代码重新推送到远程分支上。所以我想使用别名(例如:git repushall)在 git 上自动化这些不同的命令: git add . git commit
连接表的 SQL 别名
我有一个这样的查询: select a1.name, b1.info from (select name, id, status from table1 a) as a1 righ
scheme - 别名宏子句的名称
我想给一些 racket 2htdp 函数/宏起别名，这样我就可以为我的 child 将它们翻译成另一种语言。我可以简单地用define给函数起别名。我在使用 big-bang 结构时遇到了麻烦；例
具有多个命令的 Git 别名
经过审查后，我需要更改一些代码并将所有更改代码重新推送到远程分支上。所以我想使用别名(例如:git repushall)在 git 上自动化这些不同的命令: git add . git commit

首页

博学

6Ren·AI

商城

hadoop - Apache Pig - 处理中间别名？