gpt4 book ai didi

java - 什么是 hbase 压缩文件大小

转载 作者:可可西里 更新时间:2023-11-01 15:15:07 25 4
gpt4 key购买 nike

我最近读到,在 Hbase 主要压缩之后,如果存储文件的大小变得大于 hbase.hregion.max.filesize,即 256MB,那么它再次溢出到 2。所以谁能解释压缩是在什么文件上完成的尺寸。major compaction后形成的storefile会有多少列族的数据?

最佳答案

hbase.hregion.max.filesize 顾名思义,指的是区域大小。区域本质上是您的 hbase 数据的分区(存储为 hfile)。 HBase 会将您的数据存储到区域中,如果区域变得太大(太大由 hbase.hregion.max.filesize 定义),将拆分该区域为两个地区。

一般来说,256MB 的区域大小相当小,大多数用例都需要更大的区域。确定确切的尺寸可能有点像黑暗艺术,但这里有引用:http://hbase.apache.org/book/ops.capacity.html#ops.capacity.regions .

在htable描述符中创建表时可以设置region大小

每个区域都应该有您的表定义的所有列族。为了进一步调整性能,您可以为每个列族指定一个 block 大小,这可能会影响扫描、获取和写入的性能。

您还可以查看此资源以获取配置提示: http://hbase.apache.org/book/important_configurations.html

关于java - 什么是 hbase 压缩文件大小,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24834448/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com