gpt4 book ai didi

hadoop - 仅为 Hadoop 作业输出关闭复制

转载 作者:可可西里 更新时间:2023-11-01 14:21:17 26 4
gpt4 key购买 nike

有没有办法将特定 MapReduce 作业输出的复制因子设置为不同于集群的其余部分(比如 1)?我希望我的主要数据集是 3x 副本(目前是这样),但是我的一些作业的输出会很快移出集群并最终被丢弃,因此不需要复制并且我可以使用空间.

我可以使用 setrep但我认为我只能在事后才这样做。

最佳答案

当你上传一个文件时,你可以通过传递来覆盖DFS默认的复制因子

-D dfs.replication=1

当您调用作业时,这应该也能正常工作。

关于hadoop - 仅为 Hadoop 作业输出关闭复制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8056555/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com