gpt4 book ai didi

indexing - HBase 是如何管理其索引的?

转载 作者:可可西里 更新时间:2023-11-01 16:34:39 24 4
gpt4 key购买 nike

如果 HDFS 是只读的(或在基本场景中可追加),它如何维护有序索引?

它是否将其索引存储在 HDFS 或一些永久存储中?

[编辑] 例如,假设我按此顺序添加了行 F B A E。由于 HDFS 只能追加,我怀疑磁盘上行的顺序将与插入顺序相同。但它如何维护其索引或保持其键有序? - 因为它存储 key 的区域是一次性写入的。

最佳答案

HBase 没有索引。它具有有序键(大致相当于 SQL Server 中的聚集索引,或 Oracle 中的索引组织表,但没有 b 树),这些键使用有序分区和时间戳写入进行维护。

当 memstore 达到特定(可配置)大小时,HFiles 刷新到磁盘,你是对的 - 它们只写入一次,此后不会修改。当 HBase 运行压缩时,多个文件从磁盘读取、合并,然后重新写入一个更大的(合并的)文件。然后删除较小的文件。

与此同时,预写日志 (WAL) 会定期(默认为 10 秒)写入 HDFS,并包含给定区域服务器的有序编辑集。我相信 WAL 需要 HDFS Append才能正常工作。

所有这些以及更多信息@我在此处关于 HBase 的演示:http://www.slideshare.net/trihug/intro-to-apache-hbase-by-chris-shain-of-tresata在这里 http://outerthought.org/blog/465-ot.html在这里 http://outerthought.org/blog/417-ot.html

关于indexing - HBase 是如何管理其索引的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9162771/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com