hadoop - 使用 hbase.hregion.max.filesize 自动分割 HBase 区域-6ren

hadoop - 使用 hbase.hregion.max.filesize 自动分割 HBase 区域

转载作者：可可西里更新时间：2023-11-01 14:16:32

25

4

我正在使用 HBase 的 cloudera 发行版 (hbase-0.94.6-cdh4.5.0) 和 cloudera 管理器来设置所有集群的配置。

我已经为 HBase 设置了以下属性:

<property>
<name>hbase.hregion.max.filesize</name>
<value>10737418240</value>
<source>hbase-default.xml</source>
</property>

注意: 10737418240 <=> 10G

因此，根据我阅读的所有文档，数据应累积到单个区域中，直到区域大小达到 10G。

但是，好像不行。。。也许我错过了什么......

这是我的 hbase 表的所有区域及其大小:

root@hadoopmaster01:~# hdfs dfs -du -h/hbase/my_table 第719话 0/hbase/我的表/.tmp 222.2 M/hbase/my_table/08e225d0ae802ef805fff65c89a15de6 602.7 M/hbase/my_table/0f3bb09af53ebdf5e538b50d7f08786e 735.1 M/hbase/my_table/1152669b3ef439f08614e3785451c305 2.8 G/hbase/my_table/1203fbc208fc93a702c67130047a1e4f 379.3 M/hbase/my_table/1742b0e038ece763184829e25067f138 7.3 G/hbase/my_table/194eae40d50554ce39c82dd8b2785d96 627.1 M/hbase/my_table/28aa1df8140f4eb289db76a17c583028 274.6 M/hbase/my_table/2f55b9760dbcaefca0e1064ce5da6f48 1.5 G/hbase/my_table/392f6070132ec9505d7aaecdc1202418 1.5 G/hbase/my_table/4396a8d8c5663de237574b967bf49b8a 1.6 G/hbase/my_table/440964e857d9beee1c24104bd96b7d5c 1.5 G/hbase/my_table/533369f47a365ab06f863d02c88f89e2 2.5 G/hbase/my_table/6d86b7199c128ae891b84fd9b1ccfd6e 1.2 G/hbase/my_table/6e5e6878028841c4d1f4c3b64d04698b 1.6 G/hbase/my_table/7dc1c717de025f3c15aa087cda5f76d2 200.2 M/hbase/my_table/8157d48f833bb3b708726c703874569d 118.0 M/hbase/my_table/85fb1d24bf9d03d748f615d3907589f2 2.0 G/hbase/my_table/94dd01c81c73dc35c02b6bd2c17d8d22 265.1 M/hbase/my_table/990d5adb14b2d1c936bd4a9c726f8e03 335.0 M/hbase/my_table/a9b673c142346014e01d7cf579b0e58a 502.1 M/hbase/my_table/ae3b1f6f537826f1bdb31bfc89d8ff9a 763.3 M/hbase/my_table/b6039c539b6cca2826022f863ed76c7b 470.7 M/hbase/my_table/be091ead2a408df55999950dcff6e7bc 5.9 G/hbase/my_table/c176cf8c19cc0fffab2af63ee7d1ca45 512.0 M/hbase/my_table/cb622a8a55ba575549759514281d5841 1.9 G/hbase/my_table/d201d1630ffdf08e4114dfc691488372 787.9 M/hbase/my_table/d78b4f682bb8e666488b06d0fd00ef9b 862.8 M/hbase/my_table/edd72e02de2a90aab086acd296d7da2b 627.5 M/hbase/my_table/f13a251ff7154f522e47bd54f0d1f921 1.3 G/hbase/my_table/fde68ec48d68e7f61a0258b7f8898be4

如你所见，有很多区域，其中任何一个的大小都接近10G ...

如果有人遇到过此类问题或知道是否有其他配置需要设置，请帮助我!

谢谢

最佳答案

@mpiffaretti，您所看到的是非常有效的。当我第一次看到自动分割后的区域大小时，我也感到有些震惊。

在 HBase 0.94+ 中，默认的拆分策略是 IncreasingToUpperBoundRegionSplitPolicy .区域大小由以下算法决定。

Split size is the number of regions that are on this server that all are of the same table, cubed, times 2x the region flush size OR the maximum region split size, whichever is smaller. For example, if the flush size is 128M, then after two flushes (256MB) we will split which will make two regions that will split when their size is 2^3 * 128M*2 = 2048M. If one of these regions splits, then there are three regions and now the split size is 3^3 * 128M*2 = 6912M, and so on until we reach the configured maximum filesize and then from there on out, we'll use that.

这是一个非常好的策略，因为您可以开始在区域服务器上很好地分布区域，而不必等到它们达到 10GB 限制。

或者，您最好预先拆分您的表，因为您希望确保您能充分利用集群的处理能力——如果您只有一个区域，所有请求都将转到区域分配到的区域服务器。预拆分将区域如何在行键空间上拆分的控制权交给了您。

关于hadoop - 使用 hbase.hregion.max.filesize 自动分割 HBase 区域，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23872556/

25

4

0

文章推荐： hadoop - 使用 Oozie 执行 Sqoops

文章推荐： scala 文件名太长

文章推荐： hadoop - HBase 错误 : zookeeper. znode.parent 不匹配

文章推荐： hadoop - 多个服务可以使用同一个 Zookeeper 实例吗？

filesize - 计算unix终端中特定文件的总空间消耗
我有一个包含 .tcb 和 .tch 文件的文件夹。我需要知道所有 .tcb 文件的大小，分别是所有 .tch 文件的大小。我确实喜欢这样: 1)我创建了一个临时文件夹，然后: mv *tch te
filesize - ICO最大尺寸
如果分辨率大于 256x256，有没有办法将图像转换为 ICO 格式？我找到了几个程序，但没有一个能够转换更大的图像。我需要的尺寸是 1024x1024。最佳答案由于宽度和高度在 ICO 图像格
php filesize() 总是返回相同的值
我正在尝试通过 PHP 上传图像。上传时，它应该调整大小，使其尺寸与我在配置 [] 数组中定义的一样大，并且其文件大小也小于或等于我的配置 [] 数组中的预定义值。但不知何故，方法 getFileSi
delphi - FileSize，与这个程序有什么区别以及什么更好用？
关于获取文件的大小，我有这两个函数: function GetFileSize1(const FileName: TFileName): Int64; var iTmp: Int64; Searc
delphi - FileSize 函数的问题
我正在尝试使用system.filesize函数来获取delphi中文件的大小，它对于4GB的文件则失败。所以我实现了自己的，将所需的文件作为文件流打开，并获取完美运行的流大小。这是一个片段
php - filesize() 不显示实际大小
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: PHP – get the size of a directory 我在一个目录中有 5 个文件，它显示文件
delphi - FileSize 函数的速度问题
好的，我使用此函数来获取程序中的文件大小，即使对于 4GB 以上的文件，它也能很好地工作。 function FileSize(const PathtoFile: string): Int64; v
javascript - 用JS判断图片404/filesize
我在 JS 中有这个预加载图像的功能: // http://stackoverflow.com/questions/3646036/javascript-preloading-images var p
php - 发送附件邮件时出现错误警告 : filesize()
错误: Warning: filesize() [function.filesize]: stat failed for http://website.com/wp-content/uploads/2
php - 为什么我从 `filesize` 得到如此准确的结果？
当我运行这段代码时: 我得到结果 10，这是文件中正确的字符数。但是，由于文件系统 block 比这大得多，我希望文件大小“四舍五入”到更接近 512 字节甚至 1KB。为什么不是？最佳答案不
javascript - document.fileSize 浏览器支持
除 IE 之外的任何浏览器是否支持 document.file Size 或同等大小？ http://msdn.microsoft.com/en-us/library/ms533752(v=VS.85
PHP filesize() 适用于除一个文件外的所有文件，给出统计失败错误
我正在编写一个 PHP 页面，它通过抓取现有的 HTML 页面来生成播客提要。一切正常，但我的一个 mp3 文件出现“filesize(): stat failed”错误。据我所知，该文件没有损坏，并
php - 不理解工作 filesize() 函数
$path = "/////////."; echo filesize( $path ); 结果是 4096 这是什么……失败了？ 4096 是从哪里来的？最佳答案回答: $path = "///
php - 为什么 PHP filesize() 函数不起作用？
我注意到当我尝试使用如下路径列出目录的内容时，filesize 不起作用: ../ 例如这个有效: if ($handle = opendir('./')) { while (false !=
php - 为什么 PHP filesize() 函数不起作用？
我注意到当我尝试使用如下路径列出目录的内容时，filesize 不起作用: ../ 例如这个有效: if ($handle = opendir('./')) { while (false !=
javascript - Jquery-validation filesize 显示人类可读的值
我想在此脚本中显示 1MB 错误消息而不是 1024: http://jsfiddle.net/tyaenm09/37/ 使用带有文件大小扩展名的 jquery-validation 插件。当然，我可
java - 在 InputStream 之前获取 FileSize
我想为 FTP 下载创建一个进度条。我下载文件的服务器隐藏了所有目录和文件。我想显示下载进度。有什么办法可以获得文件大小吗？这是我当前的代码: FTPclient = new FTPClient
C# 无法将 FileSize 从字节转换为 GB
这个问题在这里已经有了答案: Why does integer division in C# return an integer and not a float? (8 个答案) Division
PHP filesize() 在文件 > 2 GB
我一直在苦苦思索如何在 PHP 中获取大于等于 2 GB 的文件的有效文件大小。例子在这里，我使用 filesize() 函数检查一个 3,827,394,560 字节大的文件的文件大小: ech
javascript - 无法读取未定义的属性 'fileSize' (req.file) (multer)
代码: var upload = multer({dest:"./uploads"}); app.post("/", upload.single("file"), function (req, res

首页

博学

6Ren·AI

商城

hadoop - 使用 hbase.hregion.max.filesize 自动分割 HBase 区域