java - Spark : Technical terminology for reduce elements on the run-time?-6ren

java - Spark : Technical terminology for reduce elements on the run-time?

转载作者：可可西里更新时间：2023-11-01 16:30:34

27

4

在下面的字数统计示例中:

(Hello,1)
(Hello,1)
(Hello,1)
(Hello,1)
(Hello,1)

Hadoop 的 reducer 函数会收集所有 5 个键为“Hello”的元素，然后在 reducer 函数中进行聚合。

但是在Spark中，实际上是每次减少2个元素。比如把第一个和第二个(Hello,1)组合成(Hello,2)，把第三个和第四个(Hello,1)组合成(Hello,2)……等等(当然，真实情况可能是在不同的顺序)。

那么有专门的术语来描述Spark中使用的这种计算方法吗？谢谢!

最佳答案

它不一定以这种方式聚合值。您认为 MapReduce 中的映射器如何工作？

你可以把它想象成一个 hashmap。如果它发现键已经在 HashMap 中，它会增加值，如果没有，它会将键插入 HashMap 中，然后初始化值。

除非我忘记了一些数学运算，否则你不能在某些组合中添加 1+1+1+1+1 而不添加 1+1,+1,+1,+1。

关于java - Spark : Technical terminology for reduce elements on the run-time?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34644181/

27

4

0

文章推荐： python - 使用python下载大量文件

文章推荐： c++ - 为什么 std::noskipws 不起作用，或者它应该做什么？

文章推荐： java - Grizzly 的 Request.getPathInfo 总是返回 null？

technical-debt - 是否存在不值得发生的特定 "technical debts"？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
technical-debt - 您如何估算清除技术债务的投资返回率？
我目前正在使用一个相当老的产品，该产品背负着过去糟糕的程序员和糟糕的开发实践带来的大量技术债务。我们开始变得更好，技术债务的产生已经大大放缓。我已经确定了应用程序中状况不佳的区域，并且我可以估算修复
php - Same Technic 无法更新和删除 while 循环记录
我从这段代码中使用删除横幅删除 while 循环记录，但现在我使用相同的东西从 while 循环更新记录，它没有给出错误，但它没有工作，即使我一个一个地检查查询是正确的。
javascript - HTML5 服务器发送事件 : technical details?
我对 HTML5 的新服务器发送事件的技术背景很感兴趣。那里到底发生了什么？您不需要服务器端的特殊功能 - 只需一如既往地发送您的数据，例如html HTTP 仍然是一种请求/响应协议(protoc
javascript - 渐进式宽度调整 : is this for aesthetic or technical reasons?
不是我想宣传 buydomains.com(实际上我鄙视他们的商业模式)而是需要展示它来说明我的问题，抱歉。我遇到了 this website当您向上/向下调整浏览器窗口的宽度时，元素的大小会慢慢向
SQL 连接 : Technical name for table identifier
当我使用 A.column name, B.Column name where A = Table A and B = Table B 时，A.Column name 的技术名称是什么？它是前缀、标识
c - C : are these types identical technically, 中的类型声明等效还是只是实用上相同？
这个问题已经有答案了: What is the difference between const int*, const int * const, and int const *? (23 个回答)
java - 混合代码( native 、托管): how does it (technically) interoperate?
我基本理解托管代码和 native 代码的概念及其 difference .但是他们之间如何在技术上进行交流呢？想象一下以下示例: 我得到了一些为特定平台编译的静态或动态 C++ 库。现在我写了一个
c# - C# : What are technical reasons to prefer///or/** 中的文档注释
C# 语言规范的附录 A 处理文档注释，它指出有两种形式: single-line-doc-comment: /// input-charactersopt delimited-doc-comment
node.js - Express.js : naive technical inquiry
我在理解express.js路线时遇到了一些麻烦如果我设置开箱即用的 hello world 应用程序，我将获得带有单个路由的基本设置 app.get('/', routes.home); 正如在e
objective-c - Mac应用商店: Technical vs Ethical Submission Guidelines
我读过很多关于 Mac App Store 审查指南的帖子，但它更多地处理道德问题(年龄评级、版权、隐私等)，而不是代码编写中的实际不当行为(存储、保护等) ...) 但是，论坛上似乎到处都是看到他们
azure - 为什么选择 Azure FHIR 服务器？有 "technical"差异吗？
我有一个与 Azure FHIR 服务器相关的一般性问题。具体来说，是否有“技术”原因使用它来存储电子健康记录(EHR)？人们告诉我，主要的医疗保健提供商正在使用 FHIR 服务器来存储 EHR。我
xcode - SWIFT/代码 : Get (technical) name of font for code
通过代码分配字体名称时，我需要一个与任何字体选择或文件名对话框中显示的名称不同的名称。我如何获得正确的拼写？例如。对于 SKLabelNode(fontNamed: "GillSans-BoldI
使用 testflight 进行 iOS 内部测试 - 如何在没有 "technical"角色的情况下进行测试？
我有许多来自不同部门的用户作为“内部测试人员”添加到 iOS 开发人员计划中。有时应用程序提交过程会出现错误，生成可怕的电子邮件，例如: iTunes Connect:您的应用“应用名称”(Apple
java - Spark : Technical terminology for reduce elements on the run-time?
在下面的字数统计示例中: (Hello,1) (Hello,1) (Hello,1) (Hello,1) (Hello,1) Hadoop 的 reducer 函数会收集所有 5 个键为“Hello”
project-management - 软件项目经理 : what is the best amount and quality of purely technical background?
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 9 年前。 Improve
ios8 - 在 iTunes Connect 中添加具有 "technical"角色的用户以使用试飞向他们发送 beta 版本是否安全？
我正在尝试使用 Test Flight 为我的应用程序招募一些 beta 测试人员。没有一个测试人员会是内部员工或类似的东西——只是我认识的一些人愿意帮助测试我的应用程序(我是一个业余爱好者，反正没有
Azure AD B2C 自定义策略 : REST technical profile validation doesn't work
我创建了一个用于在 Azure AD B2C 上注册的自定义策略，目的是只允许电子邮件被列入白名单的用户能够注册到系统中。为此，我使用 REST 技术配置文件配置了自定义策略。我遵循了这个指南:h
sql - 数据库与纯文本文件 : What are some technical reasons for choosing one over another when performance isn't an issue?
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
javascript - (概念)AJAX GET 请求与 HTTP GET 请求 : who is technically the client?
因此，当通过浏览器完成正常的 GET 请求时，我认为浏览器是客户端。但是，当通过 AJAX 发出 GET 请求时，客户端是谁？我知道它仍然通过浏览器发生，但我想看看是否可以更详细地了解它。你是否可以

首页

博学

6Ren·AI

商城

java - Spark : Technical terminology for reduce elements on the run-time?