gpt4 book ai didi

azure - Hive 外部表 - 删除表/分区并删除数据

转载 作者:行者123 更新时间:2023-12-03 05:51:20 26 4
gpt4 key购买 nike

当删除 Hive 外部表或分区时,它只会从 Hive 元存储中删除元数据。 HDFS/Azure 存储帐户中的基础数据不会被删除。删除表/分区时删除数据的选项有哪些?

最佳答案

我一直在做一些研究,这些是我的发现

选项 1:如果使用 HDInsight,则删除表/分区并删除 HDFS/Azure Blob 存储中的相应文件。

选项 2:更新 hive 元存储以使表属性成为托管的。删除分区并更改回外部表属性,如下所示。

ALTER TABLE poc_drop_partition SET TBLPROPERTIES('EXTERNAL'='FALSE') ;
ALTER TABLE poc_drop_partition DROP IF EXISTS PARTITION(partition_date <= '2017-10-11');
ALTER TABLE poc_drop_partition SET TBLPROPERTIES('EXTERNAL'='TRUE') ;

类似地,DROP table 语句将删除表和底层数据文件。

有没有更好的方法可以做到这一点。我知道 JIRA 中有 TRUNCATE 功能需要开发。

关于azure - Hive 外部表 - 删除表/分区并删除数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47639756/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com