gpt4 book ai didi

hadoop - Hive 中 Cluster By 和 CLUSTERED BY 的区别?

转载 作者:可可西里 更新时间:2023-11-01 16:23:27 27 4
gpt4 key购买 nike

我想知道 Hive 中 Cluster By 和 CLUSTERED BY 的主要区别是什么。

Cluster By 用于对表进行分桶。并且会用到Hash函数。

CLUSTERED BY 用于在 reducer 中按值排序。

还有什么区别吗。

请告诉我

谢谢

文卡特巴拉。

最佳答案

“聚类依据”仅将您的键分布到不同的桶中,“聚类依据”确保 N 个缩减器中的每一个都获得不重叠的范围,然后在缩减器中按这些范围排序。主要区别在于排序。

关于hadoop - Hive 中 Cluster By 和 CLUSTERED BY 的区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34495981/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com