gpt4 book ai didi

hadoop - 什么是元数据 DB Derby?

转载 作者:可可西里 更新时间:2023-11-01 16:54:18 26 4
gpt4 key购买 nike

我是 Apache Hadoop 的新手。我遇到了一些 Derby 。元数据 DB Derby 是什么意思。我听说这是一些文件系统。但是有人能说出它到底是什么及其工作原理吗?

最佳答案

Hadoop 的 Namenode 存储有关文件在 HDFS 上的存储位置的元数据。也就是说,当您将一个文件放到 HDFS 上时,它会被复制 3 次(默认情况下)并且 Namenode 会跟踪哪 3 个服务器正在托管该文件。

Hive 的元数据与 Namenode 的元数据是分开的。 Hive 的元数据维护其底层分区、表、数据库等的位置。表模式也存储在 Hive 的元数据中。 Hive 需要数据库后端来维护此元数据,Derby 只是 Hive 的默认嵌入式元存储。

参见 http://hortonworks.com/blog/hdfs-metadata-directories-explained/https://cwiki.apache.org/confluence/display/Hive/AdminManual+MetastoreAdmin

关于hadoop - 什么是元数据 DB Derby?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30705290/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com