gpt4 book ai didi

apache - HBase模式设计示例

转载 作者:行者123 更新时间:2023-12-02 20:58:36 25 4
gpt4 key购买 nike

我想要一些有关HBase模式设计的建议。
例如,有2000名患者,即1。每个患者都有姓名,性别,年龄,医院ID。 2.将每分钟记录每位患者的 Activity 数据,例如心脏位,位置和步数。 3.每位患者将接受几份问卷。

如何组织HBase表?

非常感谢您的帮助

我当前的想法是使用Patient_ID作为行键。每个病人在HBase表中只有一行。但是,所有 Activity 数据都将在嵌套表中分组。 Activity 数据表将具有数百万行。
因此,该表将具有三个列族。 CF1:信息,CF2: Activity 数据,CF3:问卷。

然后,
CF1:信息包括(姓名,性别,年龄,ID)

CF2:activity_data(数据(嵌套表))

CF3:questionnaires(questionnaired_ID(嵌套表))

我不知道这是否是设计HBase模式的明智方法。
请给我一些建议。

非常感谢你

最佳答案

  • 在设计数据模型时,了解数据的用法非常重要,尤其是要对存储在HBase中的数据高效(无全表扫描)的查询。
  • activity_data似乎是原始数据,但其他两个部分与“患者资料”有关。有一个recommendation可以使同一表中的列族的大小大致相同。然后,最好将activity_data保留在另一个表中,然后进行汇总以得出每日摘要,并将结果存储在“患者资料”表中。

  • 希望对您有所帮助。

    关于apache - HBase模式设计示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43807885/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com