gpt4 book ai didi

HBase 列族 : how many?

转载 作者:行者123 更新时间:2023-12-04 02:44:00 24 4
gpt4 key购买 nike

可能有很多类似的问题,但他们没有回答我的情况(至少我无法理解这一点)。

  • 我在 HBase 中有一个表,有 4 个列族。主要原因是每个列族都有不同的 VERSIONS 属性(非常不同)。
  • 所有族的所有列都没有存储大数据(例如全文)而是平均1KB(长的标识符,一些短字符串,整数等)
  • 我需要以多种方式访问​​数据:按列族扫描和获取,按版本(特定版本或范围)获取给定行的所有单元格,最后但并非最不重要的是:获取给定行所有列的最新版本.

  • 那么,在这种情况下,拥有 4 个列族的缺点是什么?读取效率是否较低,因为它们在不同的存储文件上操作(以防该行不在内存中)?

    最佳答案

    列族背后的想法很棒 - 不幸的是,当前的 HBase 实现不能很好地处理很多列族。基本上,如果您有完全不同的访问模式,您应该尝试坚持使用一个并添加第二个。另见 HBase manual

    您可以做的是将不同的“家庭”保留为具有不同前缀的列。 HBase 是稀疏的,因此它不会占用更多空间,如果需要,您仍然可以获得一个带有 columnPrefix 过滤器的“家庭”扫描

    关于HBase 列族 : how many?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12770056/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com