gpt4 book ai didi

java - HBase 表没有按预期收缩

转载 作者:行者123 更新时间:2023-11-30 11:50:45 28 4
gpt4 key购买 nike

我有一个独立的 HBase 实例(没有 hadoop)运行在一个单一的机器。

原来是32G,更新了一些列定义后从外壳:

alter 'table', {NAME =>'mycol', TTL => <two_months>}
alter 'table', {NAME =>'mycol', COMPRESSION => 'GZ'}

数据存储一夜之间从 32G 增长到 51G(不是新数据造成的!)。我预计该表会缩小,因为大多数条目都早于 two_months。此外,我已请求对该列进行压缩。

我想了解为什么运行 alter 命令会导致大小大幅增加,我可以预期它会再次缩小吗?

我原以为它会在下一次主要压实时缩小,已经超过 24 小时了,我很惊讶这还没有发生。

最佳答案

对于 TTL 问题,只需像 juhanic 所说的那样强制进行主要压缩。压缩比较棘手,因为 hbase 还没有自动合并 block 的方法(在 jira 中有关于它的问题),你的 block (区域)数量不会改变。当我切换压缩时,我更喜欢导出 -> 截断 -> 重新导入数据。

小提示:如果大小是一个问题,最简单的优化是降低 VERSIONS 值(如果可能,降低到 1)。我猜你已经这样做了。

关于java - HBase 表没有按预期收缩,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7808209/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com