gpt4 book ai didi

hadoop - Hive 表已排序但未排序插入

转载 作者:可可西里 更新时间:2023-11-01 16:23:23 27 4
gpt4 key购买 nike

如果
创建表 X (...) 按(日期)聚类按(时间)排序

但插入时没有排序
插入 x select * from raw

在插入之前从原始数据中提取数据后会排序吗?

如果插入未排序的数据create table 语句中的“sorted by”是做什么的。它只是为以后的选择查询提供提示?

最佳答案

documentation解释:

The CLUSTERED BY and SORTED BY creation commands do not affect how data is inserted into a table – only how it is read. This means that users must be careful to insert data correctly by specifying the number of reducers to be equal to the number of buckets, and using CLUSTER BY and SORT BY commands in their query.

如果您使用该选项,我认为很明显您想插入已排序的数据。

关于hadoop - Hive 表已排序但未排序插入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36490491/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com