hadoop 管道写入和 Rack 感知-6ren

hadoop 管道写入和 Rack 感知

转载作者：行者123 更新时间：2023-12-02 21:47:56

27

4

当每个文件写入集群时，HDFS 会创建一个复制管道。假设有两个 Rack 1 和 5。根据 Rack 感知，第一个 block 将被保存到 Rack 1，其他两个复制 block 将被插入 Rack 5。

我很困惑为什么hadoop管道会将第二个和第三个复制 block 存储在同一个 Rack (5)中，而不是将第一个和第二个 block 存储在同一个 Rack (1)中？两种情况都具有相同的网络流量。它有什么好处？

谢谢。

请引用此图http://bradhedlund.s3.amazonaws.com/2011/hadoop-network-intro/HDFS-Pipleline-Write-s.png

最佳答案

这适用于 HDFS 1.2 将两个 block 都放在远程 Rack 上的原因是为了尽量减少 Rack 间的流量。由于第二个 block 已经在远程 Rack 上，因此在远程 Rack 上的两个服务器之间复制该 block 不会消耗 Rack 之间链路的带宽。如果采用高效设计的架顶式交换机这会将带宽利用率降至最低。在繁忙的集群上，两个 Rack 上都会发生相同的过程。其中 Rack A 和 Rack B 将以大致相同的速率生成 block 。因此，遵循此策略有助于平衡所有链路的带宽利用率。

关于hadoop 管道写入和 Rack 感知，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23581749/

27

4

0

文章推荐： assembly - x86 128 位原子操作

文章推荐： javascript - 启动另一个 javascript 时暂停另一首歌曲

文章推荐： gnu-make - GNU Make : disable all built-in rules, 除了所需的

文章推荐： assembly - intel机器码转汇编代码的问题

ruby-on-rails - Rack 和 rack.request.form_vars/rack.request.form_hash
我正在做一些中间件，在它到达 Rails 之前更改 authenticity_token 参数。我可以看到 env.inspect 给出了 rack.request.form_vars 和 rack
ruby-on-rails - Rack 1.3.2 的问题。您已经激活了 rack 1.3.2，但是您的 Gemfile 需要 rack 1.2.3
我在带有 gem rack 1.3.2 和 1.2.1 的 debian 上安装了 passenger 3.0.9。使用带有 passenger e bundler 的 rails 3.0 应用程序
rack - Rack 应用程序中的 Rails.root 等价物是什么？
我熟悉 Rails.root在 Rails 中，它会告诉您当前应用程序的目录。这有时非常方便。现在我正在开发一个 Rack 应用程序(Rails 基于它)。我如何找到 Rails.root相当于 R
ruby - Rack 应用程序 : can't activate rack, 已激活
这个问题在这里已经有了答案: You have already activated X, but your Gemfile requires Y (12 个答案) 关闭 8 年前。我有一个在 Dr
ruby - Rack::Deflater 和 Rack::URLMap
我想根据响应主体的大小有条件地启用 Rack::Deflater，如下所示: use Rack::Deflater, :if => lambda { |*, body| body.map(&:byte
ruby-on-rails - Rack rack.input 变量被截断了吗？
我写了一段 Rack Middleware 来自动解压缩压缩的请求体。代码似乎工作正常，但是当我将它插入我的 Rails 应用程序时，我从 ActionController::ParamsParser
ruby-on-rails - Rails/Rack... Rack::ReverseProxy 导致请求超时
我想我在我的头上，无法弄清楚如何调试或从这里去哪里？!任何指导将不胜感激! 问题: 开发环境:一切正常生产:我收到“请求超时”错误目标: 让“www.site.com/blog”显示来自“blog
ruby - Rack::Builder 和 Rack::TryStatic 不起作用
我有一个 Middleman我正在使用 Rack::TryStatic 服务的应用程序。这是config.ru。 use Rack::TryStatic, root: 'build', ur
ruby - 结合 Rack::Builder 和 Rack::Cascade
很抱歉，如果这个问题与另一个问题重复，但我还没有找到它。我有一些 Grape API(它们是 Rack 应用程序)，其中之一(用户 API)使用中间件进行身份验证。在我的 config.ru 文件
ruby - Rack:单个 Rack 应用程序的多个 session cookie
如何在单个 Rack 应用程序中与多个 session cookie(针对不同的路径或域)进行交互？例如，考虑以下使用 3 个位置的应用程序: www.my-app.net => 主应用 www.m
ruby-on-rails - 在 Rack 中的哪里插入 Rack::Deflater？
我目前有以下内容: use Rack::Rewrite use Rack::Cache, {:verbose=>true, :metastore=>"memcached://localhost:112
rack - 如何将 url 路由到 Rack 中的 CGI 脚本？
我有一个应用程序，它有一个包含静态文件的 htdocs 文件夹和位于 httpd/cgi-bin 文件夹中的几个 CGI 脚本。我如何使用带有 config.ru 的 Rack 来为这个应用程序提供服
ruby - 如何将 Rack 中间件注入(inject)现有的 Rack 应用程序？
给定一个非 Rails 的 Rack 应用程序，构建器.rb: def app Rack::Builder.new{ use Rack::Static, urls:static_path
ruby - Rack 并发 - rack.multithread、async.callback 或两者兼而有之？
我试图完全理解 Rack 中并发请求处理的选项。我已经使用 async_sinatra 构建了一个长轮询应用程序，现在正在使用 throw :async 和/或 Thin 的 --threaded 标
ruby-on-rails - Rack rSpec Controller Tests with Rack Middleware 问题
我在使用 rSpec 的 Controller API 进行测试时遇到了很大的麻烦。现在我正在使用中间件身份验证解决方案 ( Warden )，当我运行规范时，中间件添加的代理不存在，所有身份验证测试
ruby-on-rails - 如何强制 Rack 解决通常的 "You have already activated rack..."错误？
这是一个常见问题，但似乎没有一个答案能解决问题。我得到了通常的:You have already activated rack 1.4.1, but your Gemfile requires rac
ruby - Sinatra rspec capybara : "rack test requires a rack application"
当运行 rspec 以使用 Sinatra Base 测试功能测试时，我们收到以下错误。这就是我们的功能测试的样子 require 'capybara/rspec' feature 'Ent
ruby - 初始化' : rack-test requires a rack application, 但没有给出 (ArgumentError)
从 Selenium 切换到 PhantomJs/Poltergeist 时，我一直收到此错误。有人知道我做错了什么吗？如果我将驱动程序切换到 selenium，脚本将完美运行。每当我注释掉 defa
ruby - 在 `Rack::Session::Pool` 上使用 `Rack::Session::Cookie`
Rack::Session::Pool 有哪些不同的用例？和 Rack::Session::Cookie ？据我了解(如果我错了请纠正我): Cookie 将所有 session 键值对直接存储在
ruby - 如何强制 Rack :session + sinatra to read "rack.session" from params instead of cookies
我正在处理 oauth 1.0(twitter 和 flickr)。网站工作在80端口，oauth服务器工作在8080端口算法: 向oauth服务器发送ajax请求以检查用户是否有有效的access

首页

博学

6Ren·AI

商城

hadoop 管道写入和 Rack 感知