gpt4 book ai didi

hadoop - MultipleOutputs 具有不同的 FileOutputFormat

转载 作者:可可西里 更新时间:2023-11-01 16:55:55 24 4
gpt4 key购买 nike

我正在尝试使用 MultipleOutputs 编写多个输出文件。然而,我希望我的 FileOutputFormat 具有两种不同的格式,即不同文件的 Text 和 SequenceFileFormat。有什么办法可以实现吗?

最佳答案

引用以下链接:MultipleOutputs

使用方法:addNamedOutput

public static void addNamedOutput(Job job,
String namedOutput,
Class<? extends OutputFormat> outputFormatClass,
Class<?> keyClass,
Class<?> valueClass)

所以基本上你的代码看起来像:

MultipleOutputs.addNamedOutput(job, "Output1", SequenceFileOutputFormat.class, Text.class, Text.class);
MultipleOutputs.addNamedOutput(job, "Output1", TextOutputFormat.class, NullWritable.class, Text.class);

HTH.

关于hadoop - MultipleOutputs 具有不同的 FileOutputFormat,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29988506/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com