gpt4 book ai didi

hadoop - 如何在 hive 中使用外部表?

转载 作者:行者123 更新时间:2023-12-02 20:39:21 25 4
gpt4 key购买 nike

谁能解释为什么在 hive 中使用外部表的原因和地点?

请说明一个易于理解的方案。

最佳答案

当由 hive 表指向的基础数据集被许多目的共享时(即用于 map 缩减作业, pig 等),我们使用外部表;当由 hive 表指向的数据集仅由 hive 应用程序使用时,我们在 hive 中使用托管表。

实际上,在hive托管表中可以完全控制数据集,即在托管表中,如果要删除该表数据集,也将从HDFS中存在的hive仓库(/ usr / hive / warehouse)中删除,但是在使用外部表时,删除表,数据集不会从HDFS的配置单元仓库中删除。

假设有一个示例,您现在有50 gb的数据集,如果您出于不同目的创建数据集的多个副本,那么它只会占用更多空间,因此更好的选择是使用外部表,这样在删除表数据集时不会删除它,并且您可以通过 pig 等其他用途或任何其他用途进一步使用它。

关于hadoop - 如何在 hive 中使用外部表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50048208/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com