- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
该内容存在于HDFS documentation上。我不明白最后一行的原因。根据我的说法,如果有更多的机架,我们可以在每个机架上并行写入。这将减少总的写入时间。甚至它说,由于我们需要将数据传输到多个机架,因此写入成本也会增加。但是无论如何,我们都将数据传输到机架。
请解释我哪里错了?
http://hadoop.apache.org/docs/stable/hdfs_design.html
The NameNode determines the rack id each DataNode belongs to via the process outlined in Hadoop Rack Awareness. A simple but non-optimal policy is to place replicas on unique racks. This prevents losing data when an entire rack fails and allows use of bandwidth from multiple racks when reading data. This policy evenly distributes replicas in the cluster which makes it easy to balance load on component failure. However, this policy increases the cost of writes because a write needs to transfer blocks to multiple racks.
最佳答案
您加粗的语句旨在传达网络跃点的成本。有一个隐含的假设,即每个机柜的顶部都有一个机架式交换机,专门为该机架中的服务器提供连接。
如果要采用将每个副本放置到唯一机架的“简单”策略,那么您将为此方案中的每个块调用一个2跳以上的网络副本。与一个本地机架副本和另一个机架外副本的推荐策略相比,这是“非最佳”的,在该策略中,只有一个2+跳副本和一个1跳副本。
同样,此建议仅在位于机架交换顶部的网络拓扑中成立。如果要使用其他更平坦的网络拓扑,则将是无关紧要的。
关于hadoop - 为什么在HDFS中包含多个机架的写入会非常昂贵?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18908629/
Kafka引入了rack-id,以便在整个机架发生故障时提供冗余功能。有一个最小同步副本设置,用于指定生产者收到确认之前需要同步的最小副本数量(-1/所有配置)。有一个不干净的领导者选举设置,用于指定
Kafka引入了rack-id,以便在整个机架发生故障时提供冗余功能。有一个最小同步副本设置,用于指定生产者收到确认之前需要同步的最小副本数量(-1/所有配置)。有一个不干净的领导者选举设置,用于指定
我正在尝试使用 Sinatra、Ruby、rack、haml、pony 和 SendGrid 构建一个应用程序,并使用 git 和 RVM 部署在 Heroku 上。该应用程序是一个博客变体,应该发送
我正在尝试将 Rack OAuth-2 server 集成到我的 sinatra 应用程序中,以便在 web-server flow implementation 中使用它,但我无法使其工作:(。我在
我按照这些说明为 Rails 3.07 安装了 rack ssl:http://www.simonecarletti.com/blog/2011/05/configuring-rails-3-http
我在我的 Rails 3.1 应用程序中使用 Rack::SSL 来启用 SSL 连接。 我已将 gem 'rack-ssl' 添加到我的 Gemfile 和 require 'rack/ssl' c
当我尝试将未分配的辅助分片分配给节点时出现错误。 { "error": { "root_cause": [ { "type": "remote_transpor
我是一名优秀的程序员,十分优秀!