gpt4 book ai didi

hadoop - 胡闹 hadoop 只有一个奴隶正在爬行

转载 作者:行者123 更新时间:2023-12-02 21:57:23 24 4
gpt4 key购买 nike

我有一个3从属hadoop集群,并且正在单个网站上进行爬网。但是,只有1个从属设备正在执行访存(尽管其他从属设备仍处于 Activity 状态)。如果仅对1个域进行爬网,这是正常行为吗?有没有办法强制其他奴隶去取东西?

谢谢。

最佳答案

作为任何Hadoop MR作业设计的一部分,必须决定如何在映射器之间划分工作。
在您的情况下,nutch按站点划分了获取过程,因此仅使用一个映射器来获取数据。如果您拥有更多站点,则将分散负载。
这是一个很好的过程描述:Nutch如何与Hadoop集群一起工作?

关于hadoop - 胡闹 hadoop 只有一个奴隶正在爬行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10730903/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com