gpt4 book ai didi

java - 增加 SequenceFileInputFormat 的分割数

转载 作者:可可西里 更新时间:2023-11-01 17:00:25 27 4
gpt4 key购买 nike

我使用 SequenceFileInputFormat 作为我的 map 输入,其中键是文本,值是文本。共有 106 个文件,每个文件的大小在 500 MB 到 750 MB 之间。我查看了我的日志,其中显示拆分数为 290

我想知道是否有办法增加拆分次数,因为我的作业运行时间很长。谢谢您的帮助。

最佳答案

您可以通过使用 mapreduce.input.fileinputformat.split.maxsize 属性减小每个拆分的最大大小来增加拆分的数量。要设置的值是以字节为单位的最大拆分大小。

关于java - 增加 SequenceFileInputFormat 的分割数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24835763/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com