gpt4 book ai didi

hadoop - 如何使用动态分区在表上优化Hive查询

转载 作者:行者123 更新时间:2023-12-02 21:05:16 25 4
gpt4 key购买 nike

我必须根据resultdate格式的2/5/2013 9:24:00 AM字段根据日期和小时对表进行分区。

我正在使用日期和小时进行动态分区,并执行

insert overwrite table partition(date, hour)
{
select x,y,z, date , hour
}
from table 1.

我有大约150万条记录,大约需要4个小时才能完成。这是正常现象吗,有哪些优化方法?

最佳答案

增加群集大小,否则将花费很多时间。

关于hadoop - 如何使用动态分区在表上优化Hive查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42128783/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com