gpt4 book ai didi

时间范围查询的 Hbase rowkey 设计

转载 作者:行者123 更新时间:2023-12-01 05:02:23 25 4
gpt4 key购买 nike

我需要从开始日期到结束日期获取产品的页面 View 。所以我设计了这样的 Hbase rowkey。

ProductId(md5)_productId_dateKey(yyyymmdd)  d:pageview.

示例:productId 为 1180560。8 月 1 日至 8 月 30 日的行键为:
0f0e02e9e24c29ad2c2b28e37e4f250b_1180560_20150801

.....

0f0e02e9e24c29ad2c2b28e37e4f250b_1180560_20150830

因此,我将通过扫描带有开始行、停止行的行键轻松获得时间范围内的产品浏览量

我的问题是:

这种设计是否避免了热点?

rowkey 的长度似乎太长了。会影响性能吗?

有没有办法缩短rowkey并仍然确保避免热点,碰撞。

这种情况有更好的设计吗?

最佳答案

热点:始终建议不要使用顺序行键,即使您获得更好的扫描结果。更多信息 here .

行键长度 - 对于每个单元格,存储行键详细信息、列族和限定符详细信息。所以总是建议尽可能地拍摄它们,主要是因为相同的信息被大规模重复。

那么接下来是什么 - 盐的使用及其前缀将有助于在区域服务器之间分配行。 This能帮你

关于时间范围查询的 Hbase rowkey 设计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31783244/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com