gpt4 book ai didi

hadoop - 将数据传输到Hadoop MR/Pig中的作业中

转载 作者:行者123 更新时间:2023-12-02 21:42:44 26 4
gpt4 key购买 nike

我在HDFS中的数据上运行三种不同类型的作业。
在当前情况下,这三个作业必须分别运行。
现在,we want to run the three jobs together by piping the OUTPUT data of one job to the other job without writing the data in HDFS to improve the architecture and overall performance.
欢迎对此方案提供任何建议。

PS:Oozie不适合该工作流程。由于可伸缩性问题,也排除了级联框架。
谢谢

最佳答案

Hadoop在M / R步骤之后会固有地写入存储(例如HDFS)。如果您想在内存中存储某些内容,也许您需要研究类似Spark.的内容

关于hadoop - 将数据传输到Hadoop MR/Pig中的作业中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27506306/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com