gpt4 book ai didi

hadoop - 改善 hadoop 中的负载平衡

转载 作者:行者123 更新时间:2023-12-02 20:12:48 27 4
gpt4 key购买 nike

我有以下字符串作为键。从下面的代码中,我看到所有的键都指向同一个 reducer ,尽管有很多 reducer 。最后,同一个 reducer 重载。我想,每个键(字符串),去一个不同的 reducer 。请帮我解决这个问题。谢谢!

String a = "71 1 2";
String b = "72 1 1";
String c = "70 1 3";

int hash_a = a.hashCode();
int hash_b = b.hashCode();
int hash_c = c.hashCode();

int part_a = hash_a % 10;
int part_b = hash_b % 10;
int part_c = hash_c % 10;

System.out.println("hash a: "+hash_a+" part_a: "+part_a);
System.out.println("hash b: "+hash_b+" part_b: "+part_b);
System.out.println("hash c: "+hash_c+" part_c: "+part_c);

Output:

hash a: 1620857277 part_a: 7
hash b: 1621780797 part_b: 7
hash c: 1619933757 part_c: 7

最佳答案

一种选择是定义自定义 partitioner而不是使用默认的 HashPartitioner 来确保您的 key 在您的 reducer 中均匀分布。

关于hadoop - 改善 hadoop 中的负载平衡,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11567373/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com