- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试创建一个Hadoop集群。我正在使用经过修改的Hadoop源,它将根据机架的工作量将任务调度到不同的机架。为了对此进行测试,我希望我的Datanode的一半放在一个机架上,另一半在另一个机架上。我该如何确保?
最佳答案
Amazon EC2上没有“机架”的概念。您拥有的唯一控制级别是可用区,它是物理上不同的数据中心。但是,Hadoop群集始终在同一可用区中运行以提高速度,并且还因为,如果主节点发生故障,则整个群集也会发生故障。 (这是在EMR上的-如果您已部署了自己的集群,则可以采用多可用区。)
如果您担心避免多次中断,我的建议是“不用担心!”。 Hadoop旨在处理故障,因此,如果节点发生故障,它将把工作发送到其余节点。您可以为群集配置其他节点以替换发生故障的节点,但这不会自动完成。
与其将“我的数据节点的一半放在一个机架上,另一半的数据节点放在不同的机架上”,倒不如说每个节点都在不同的主机上,这样您可能会得到一个更大的基础设施仅有两个“机架”。但是,您无法看到此类放置。
另外,建议您将持久性数据存储在Amazon S3中,而不是HDFS 中。这样,您可以终止集群并且您的数据仍然可用,并且在最坏的情况下,如果集群发生故障,您的数据也仍然可用。这比不会损失HDFS的普通本地Hadoop部署要好。
底线:不用担心。部署群集并进行监视,以查看故障是否真正令人担忧。
关于hadoop - 如何在EC2的不同机架中创建两个实例? (AWS中的机架感知),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46613139/
Kafka引入了rack-id,以便在整个机架发生故障时提供冗余功能。有一个最小同步副本设置,用于指定生产者收到确认之前需要同步的最小副本数量(-1/所有配置)。有一个不干净的领导者选举设置,用于指定
Kafka引入了rack-id,以便在整个机架发生故障时提供冗余功能。有一个最小同步副本设置,用于指定生产者收到确认之前需要同步的最小副本数量(-1/所有配置)。有一个不干净的领导者选举设置,用于指定
我正在尝试使用 Sinatra、Ruby、rack、haml、pony 和 SendGrid 构建一个应用程序,并使用 git 和 RVM 部署在 Heroku 上。该应用程序是一个博客变体,应该发送
我正在尝试将 Rack OAuth-2 server 集成到我的 sinatra 应用程序中,以便在 web-server flow implementation 中使用它,但我无法使其工作:(。我在
我按照这些说明为 Rails 3.07 安装了 rack ssl:http://www.simonecarletti.com/blog/2011/05/configuring-rails-3-http
我在我的 Rails 3.1 应用程序中使用 Rack::SSL 来启用 SSL 连接。 我已将 gem 'rack-ssl' 添加到我的 Gemfile 和 require 'rack/ssl' c
当我尝试将未分配的辅助分片分配给节点时出现错误。 { "error": { "root_cause": [ { "type": "remote_transpor
我是一名优秀的程序员,十分优秀!