gpt4 book ai didi

mongodb - Hbase 数据应该如何才能快速查询响应?

转载 作者:可可西里 更新时间:2023-11-01 16:29:02 24 4
gpt4 key购买 nike

我的情况符合以下规则:

  1. 一个用户一次只能在一个地点。如果用户 A 在地点 X 签到,然后在 field Y,他们不再在 field X。
  2. 签到最多只能“持续”3 小时。如果用户 A 在地点 X 签到然后3 小时内什么都没有,他们不再在地点 X。

数据将使用 Kafka 和 spark-streaming 解析到 HBase。

我想使用 HBase,TTL 为 3 小时,版本控制为 1,满足上述条件。问题是我很困惑如何在 HBase 中组织数据以获得更快的查询响应,我应该使用具有 field 名称或 field 名称的单个列作为不同的列名称吗?

哪个更好,为什么?

需要执行的查询是:1.用户A现在在哪里?2. 现在 X 地点有哪些用户?

最佳答案

最高效的查询是基于HBase表的row key。我会使用用户名作为行键,以便能够快速获取特定用户所在位置的信息。每行都需要一列 - 地点。

显然,要收集所有数据(查询 2:地点 X 有哪些用户),您需要扫描整个(部分)表格。所以效率不会很高。查看 HBase 的二级索引 - 如果您遇到此类查询的性能问题。

关于mongodb - Hbase 数据应该如何才能快速查询响应?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44479855/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com