gpt4 book ai didi

hadoop - 具有多个文件的WholeFileInputFormat输入

转载 作者:行者123 更新时间:2023-12-02 21:54:59 28 4
gpt4 key购买 nike

如何将WholeFileInputFormat与许多文件一起使用作为输入?
许多文件合为一个文件...
FileInputFormat.addInputPaths(job,String ...);似乎无法正常工作

最佳答案

您需要将InputFormat中的“isSplittable”设置为“false”,以便输入文件不会被拆分,也不会仅由1个映射器处理。不过,有一个小建议,您可以尝试一下Sequence File。将您要处理的多个文件组合成一个序列文件,然后对其进行处理。由于序列文件已经是键/值形式,因此效率更高。

关于hadoop - 具有多个文件的WholeFileInputFormat输入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15735246/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com