gpt4 book ai didi

sockets - 通过套接字将 Reducers 中的全局变量/资源更新到 Hadoop 作业跟踪器

转载 作者:可可西里 更新时间:2023-11-01 15:33:50 26 4
gpt4 key购买 nike

我需要一个可以在 reducer 中同时读取/设置的全局变量(我知道这种设计的瓶颈和性能问题)。我尝试使用 Hadoop Configuration get()/set(),但我发现在提交 mapreduce 作业之前需要设置配置属性,并且在 reducer 中使用 Configuration.set() 实际上不会更新全局属性的值.

我能找到的最接近的方法是使用全局参数,而不是通过 Hadoop 作业跟踪器的套接字读取/设置,但我找不到任何说明如何完成此操作的资源。

我的问题是:

  1. 如何通过 Hadoop 作业的套接字读取/设置全局变量跟踪器。
  2. 是否有另一种方法来保存全局变量(无论性能下降如何)

注意事项:

  • Hadoop 计数器无法为我工作,因为它们不支持 set() 函数
  • DistributedCache 将无法工作,因为它用于分发只读数据,而在我的例子中,我需要 reducer 来更新全局变量的值,其他正在运行的 reduce 任务可以同时读取该值。

最佳答案

通常在 Hadoop 集群中存储可靠一致的全局变量的位置是 Apache ZooKeeper .

也就是说,在 MapReduce 作业中很少需要可变全局变量。如果您分享您的用例,则很有可能会有更简单的解决方案。

关于sockets - 通过套接字将 Reducers 中的全局变量/资源更新到 Hadoop 作业跟踪器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28606635/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com