gpt4 book ai didi

使用两个 -inputFormat 的 Hadoop 流式传输?

转载 作者:可可西里 更新时间:2023-11-01 14:59:35 25 4
gpt4 key购买 nike

假设我有两个文件,我想以不同的格式进行映射。一个是序列文件,另一个是纯文本文件。有没有办法分别为每个指定一个-inputFormat?或者我应该做些什么来映射两者?

最佳答案

这就是 MultipleInputs 类的用途。对于每个输入,您都会调用 MultipleInputs:

MultipleInputs.addInputPath(job, inputPath, inputFormatClass, mapperClass);

关于使用两个 -inputFormat 的 Hadoop 流式传输?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12464448/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com