gpt4 book ai didi

hadoop - 包含时间戳的 HBase rowkey

转载 作者:可可西里 更新时间:2023-11-01 15:30:41 27 4
gpt4 key购买 nike

我想知道像下面这样的行键是否不好:

用户名-时间戳

这些行将从 MapReduce 作业中读取,并将使用 java 客户端 API 放置。此外,将使用 STARTROW、ENDROW 选择一个子集。

一方面,这对我的用例来说似乎很方便,因为我可以扫描特定的时间间隔,并且行主要是 MR 作业的后续行,而另一方面,我读到避免长行键和热点是很好的。

这个设计真的有问题吗?如何克服?

我是 HBase 的新手,所以任何帮助都会很棒。

最佳答案

一般建议是避免单调增加行键。为此,一些软件工具在行键中包含所谓的“salt”,它可以跨区域散列键。可以在此处找到讨论:http://hbase.apache.org/0.94/book/rowkey.design.html .在这里:https://phoenix.apache.org/salted.html .您还可以查看 Apache Trafodion http://trafodion.apache.org/ ,它使用行键加盐来分发类似 SQL 的主键。

关于hadoop - 包含时间戳的 HBase rowkey,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33888065/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com