gpt4 book ai didi

hadoop - 本地模式下的 Nutch 是否独立于 Hadoop?

转载 作者:可可西里 更新时间:2023-11-01 16:29:18 25 4
gpt4 key购买 nike

我理解在deploy模式下运行Nutch是基于Hadoop的分布式爬虫,但是在local模式下运行时我无法完全理解。在那种情况下,Nutch 是否独立于 Hadoop?而且本地模式下的爬取过程不是基于MapReduce的吗?

最佳答案

Nutch 是基于 MapReduce 的,不管它是如何运行的。 Hadoop 库是 Nutch 的依赖项,在本地模式下,Nutch 将 Hadoop 相关库放在类路径中,并在单个 JVM 中运行。在分布式模式下,调用“hadoop”命令。

参见 Nutch script
PS:如果你在一台机器上使用 Nutch,以伪分布式模式运行它是有意义的,这样你就可以得到 MapReduce UI 来监控爬网 + 并行性等......

关于hadoop - 本地模式下的 Nutch 是否独立于 Hadoop?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42788374/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com