gpt4 book ai didi

java - 使用 TableMapReduceUtil 和 MultipleOutputFormat 时在 Job 和 JobConf 之间挣扎

转载 作者:行者123 更新时间:2023-12-01 15:35:46 26 4
gpt4 key购买 nike

我正在尝试读取 HBase 表 TableMapReduceUtil 并将数据转储到 HDFS (不要问我为什么。这很奇怪,但没有任何其他选项)。因此,为了实现这一目标,我想通过reducer键来操作最终文件名(由reducer发出)。

在映射器方面,我能够按照默认顺序将 hbase rotryingws 转储到 HDFS。但是为了覆盖reducer输出文件格式(按键命名),我发现reducer的MultipleOutputFormat类(由于一些接口(interface)困惑,在0.20上不存在,请在某处读取),而旧的只需要就业 session 但是,如果我尝试使用旧的 JobConf 编写代码,我将无法使用 HBase 0.90 的 TableMapReduceUtil ,它只采用 Job

对 Hadoop/HBase 没有太多的了解。花了一些时间修改现有的 MRJOb。看来我坚持我的方法。

版本 Hadoop-Core-0.20.;HBase 0.90.1

谢谢潘卡杰

最佳答案

I am not able to Use HBase 0.90's TableMapReduceUtil which only takes Job class.

org.apache.hadoop.hbase.mapred.TableMapReduceUtilorg.apache.hadoop.hbase.mapreduce.TableMapReduceUtil类。第一个将采用 JobConf(旧 MR API),第二个将采用 Job(新 MR API)。使用适当的 TableMapReduceUtil 类。

关于java - 使用 TableMapReduceUtil 和 MultipleOutputFormat 时在 Job 和 JobConf 之间挣扎,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8870967/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com