gpt4 book ai didi

hive - Hive 中 Sortby 和 orderby 查询的区别

转载 作者:行者123 更新时间:2023-12-01 07:04:55 26 4
gpt4 key购买 nike

Hive sort byorder by 命令用于按排序顺序获取数据。

例如:

排序方式

hive> SELECT  E.EMP_ID FROM Employee E SORT BY E.empid;

订购方式

hive> SELECT  E.EMP_ID FROM Employee E order BY E.empid;  

Hive SQL 中的sort byorder by 查询有什么区别?

最佳答案

Hive 支持按 reducer 对数据进行排序的 SORT BY。 “order by”和“sort by”的区别在于,前者保证输出的总顺序,而后者只保证 reducer 中行的排序。如果有多个 reducer,“sort by”可能会给出部分排序的最终结果。

注意:对于单列的 SORT BY 和 CLUSTER BY 之间的区别可能会造成混淆。不同之处在于 CLUSTER BY 按字段分区,如果有多个 reducer 随机分区则按 SORT BY 排序,以便在 reducer 之间均匀分布数据(和负载)。

基本上,每个 reducer 中的数据将根据用户指定的顺序进行排序。下面的例子说明

SELECT key, value FROM src SORT BY key ASC, value DESC

关于hive - Hive 中 Sortby 和 orderby 查询的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12852508/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com