作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个3从属hadoop集群,并且正在单个网站上进行爬网。但是,只有1个从属设备正在执行访存(尽管其他从属设备仍处于 Activity 状态)。如果仅对1个域进行爬网,这是正常行为吗?有没有办法强制其他奴隶去取东西?
谢谢。
最佳答案
作为任何Hadoop MR作业设计的一部分,必须决定如何在映射器之间划分工作。
在您的情况下,nutch按站点划分了获取过程,因此仅使用一个映射器来获取数据。如果您拥有更多站点,则将分散负载。
这是一个很好的过程描述:Nutch如何与Hadoop集群一起工作?
关于hadoop - 胡闹 hadoop 只有一个奴隶正在爬行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10730903/
有时这段代码可以正常工作,但这取决于我将要执行的部分放在哪里,这实际上是说它根本不起作用 - 但我真的不知道为什么不这样做。也许你们中的一个人能够提供一些见解: function displayBan
我有一个3从属hadoop集群,并且正在单个网站上进行爬网。但是,只有1个从属设备正在执行访存(尽管其他从属设备仍处于 Activity 状态)。如果仅对1个域进行爬网,这是正常行为吗?有没有办法强制
我是一名优秀的程序员,十分优秀!