gpt4 book ai didi

merge - 如何减少Hive中SQL "Alter Table/Partition Concatenate"的生成文件?

转载 作者:行者123 更新时间:2023-12-04 16:14:33 26 4
gpt4 key购买 nike

hive 版本:1.2.1

配置:

set hive.execution.engine=tez;
set hive.merge.mapredfiles=true;
set hive.merge.smallfiles.avgsize=256000000;
set hive.merge.tezfiles=true;

HQL:
ALTER TABLE `table_name` PARTITION (partion_name1 = 'val1', partion_name2='val2', partion_name3='val3', partion_name4='val4') CONCATENATE;

我使用HQL合并特定表/分区的文件。但是,执行后,输出目录中仍然有许多文件。并且它们的大小远远小于256000000。因此如何减少输出文件的数量。

顺便说一句,使用MapReduce代替Tez也不起作用。

最佳答案

您可以将 reducer 编号设置为1,这样只会创建一个输出文件。

您可以执行以下操作;

set mapred.reduce.tasks=1

关于merge - 如何减少Hive中SQL "Alter Table/Partition Concatenate"的生成文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33166387/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com