gpt4 book ai didi

hadoop - 为什么在HIVE中加入需要大量时间执行?

转载 作者:行者123 更新时间:2023-12-02 22:08:58 25 4
gpt4 key购买 nike

我试图加入 hive 中具有几乎相同记录数的两个表。查询需要很长时间才能执行。
为什么在 hive 式JOINS中花很长时间执行?
两个表中的记录数约为5万。

最佳答案

Hive查询会在内部转换为Map Reduce并得到执行,因此执行该查询需要几分钟。有多种提高性能的方法。您可以按照此link来提高查询性能。

使用hive或Hadoop的主要原因是要处理大量数据。因此,当您处理海量数据时,与其他关系数据库相比,您肯定会看到绝对可观的性能提升。但是,对于您提到的大量数据,Hive可能不是一个好用例。

关于hadoop - 为什么在HIVE中加入需要大量时间执行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44022993/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com