gpt4 book ai didi

hadoop - HFileOutputFormat 是否启动 reducer ?

转载 作者:可可西里 更新时间:2023-11-01 15:17:46 24 4
gpt4 key购买 nike

我使用 HFileOutputFormat 将 CSV 文件批量加载到 hbase 表中。我只有 map 而没有使用 job.setNumReduceTasks(0) 的 reduce 任务。但是我可以看到一个reducer在作业中运行,这个reducer是因为HFileOutputFormat而启动的吗?
以前我在同一个工作中使用 TableOutputFormat,其中从未运行过 reducer。我最近重构了 map 任务以使用 HFileOutputFormat,但现在经过此更改后,我可以看到一个 reducer 正在运行。

其次,我在 reducer 中遇到了以下错误,这是我之前使用 TableOutputFormat 时没有得到的,这是否也与 HFileOutputFormat 相关?

错误:java.lang.ClassNotFoundException:com.google.common.base.Preconditions

最佳答案

HFileOutputFormat 确实启动了一个(对于 HFiles 必要的)reduce 任务。

错误在那里弹出 Hadoop 需要 Google 的 Guava 库才能生成 HFile。让 Hadoop 找到这个库的最简单方法是从 $HBASE_HOME/lib/ 复制它。至 $HADOOP_HOME/lib/ .寻找guava-<version>.jar .

关于hadoop - HFileOutputFormat 是否启动 reducer ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16011789/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com