gpt4 book ai didi

scalability - 使用 Thrift 在集群上扩展 HBase 写入

转载 作者:行者123 更新时间:2023-12-04 18:19:09 26 4
gpt4 key购买 nike

我们正在尝试使用 Thrift 在集群上扩展 HBase 写入。 (我们的 HBase 应用程序使用 Python,因此需要 Thrift。)

尽管集群中的节点数量增加了,但我们看到的写入速度是相同的。

首先,运行 Thrift 的推荐策略是:
1. 客户?
2. HBase 主控?
3. HBase 区域服务器?

如果在 #1 或 #2 上,客户端或 HBase 主服务器会负责将请求拆分到各个区域服务器吗?在我们的情况下似乎没有。

如果#3,那么我必须修改客户端以写入特定区域服务器,并随机写入。我可以这样做,但这似乎违背了使用 HBase 的目的。

非常感谢有关读/写缩放(尤其是 Thrift)的任何其他技巧。

最佳答案

在 HBase 中,要通过增加节点来获得性能,您应该有一个不错的“rowkey”分布。只要您的集群中有“热点”(一个非常繁忙的区域服务器),您就不会从增加集群大小中获得任何 yield 。结帐article从行键设计开始。

如果您不需要立即阅读(如果您对异步写入感到满意),您可以查看 asynch hbase client从stumbleupon获得性能提升。

关于scalability - 使用 Thrift 在集群上扩展 HBase 写入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11057943/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com