gpt4 book ai didi

database - 当我加载数据时,配置单元在幕后做了什么?

转载 作者:可可西里 更新时间:2023-11-01 15:38:51 26 4
gpt4 key购买 nike

我知道 hive 将数据作为分区保存到 hadoop 文件系统中。但是,当我在配置单元中执行 LOAD DATA 时,具体过程是如何工作的?

感谢您的回答!

最佳答案

I know that hive saves data as partiotions into the hadoop file system.

Hive 不存储数据。 Hive 可以被认为是 MapReduce 计算模型之上的更高层次的抽象。

假设数据已经存在于 HDFS 中并且表是在 Hive 中创建的,LOAD DATA 命令只会将 HDFS 中的数据映射到 Hive 中创建的表。映射存储在 Hive metastore 数据库中,默认情况下是 derby。 Here是一篇关于 Hive Metastore 的类型以及如何配置它们的文章。

只需在 Metastore 数据库中插入/更新几行,这就是 LOAD DATA 命令速度很快的原因。

关于database - 当我加载数据时,配置单元在幕后做了什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20455737/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com