hadoop - RAMdisk 中的 HBase 速度较慢-6ren

hadoop - RAMdisk 中的 HBase 速度较慢

转载作者：可可西里更新时间：2023-11-01 15:39:44

27

4

我有一个关于将 Apache HBase 与 RAMdisk 一起使用的一般性问题。单个表中有大量数据集合，总共约 25GB。有了这些数据，我正在使用 Java 程序进行一些基本的聚合。

因为我有足够的 RAM，我尝试使用 tmpfs 将这个数据集放入 RAMdisk:

mount -t tmpfs -o size=40G none /home/user/ramdisk

然后我停止了HBase，将data文件夹的内容复制到RAMdisk中。最后我创建了一个符号链接(symbolic link)，将旧数据目录链接到新数据目录并再次启动 HBase。

它有效，但是当我现在处理聚合时，它变得比以前稍微慢。

如果 HBase 压缩数据(激活 Snappy 压缩)等等，我可以想象使用 RAMdisk 不会产生太大影响......但我无法猜测为什么更快的介质会导致更慢的速度数据的访问。有足够的可用 RAM，因此这不会成为瓶颈。

也许有人对此有一个大概的想法或见解？

最佳答案

我认为这将是两件事之一:A:在分配磁盘之前你真的有超过40G的空闲内存吗？我印象深刻，如果你真的有那么多空闲，但之后看到 ram 空闲并不表示你没有使用大量交换空间。

B:压缩(即使是像 snappy 这样快速的东西)会损害性能……特别是对于像数据库引擎这样的东西，它有很多古怪的优化。 ramdisk 应该快得离谱，这是对的，但它必须跳过所有数据库查询，然后必须跳过整个压缩图像以解压缩 block ，必须有相当大的开销。

关于hadoop - RAMdisk 中的 HBase 速度较慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18311214/

27

4

0

文章推荐： c++ - 不稳定的重载？

文章推荐： hadoop - 在phoenix for hbase 中，插入90000 行数据时插入OOM

文章推荐： c++ - OpenCV SURF 功能未实现

linux - 直接拷贝 Ramdisk 镜像到 Ramdisk 设备
好的，所以我在挂载的设备上有一个 Ramdisk 镜像，比方说，/mnt/sda1/Ramdisk.img。我想将原始数据直接复制到位于/dev/ram0 的 ramdisk 设备，这样就不需要使用
Gradle - 使用 RAMdisk
我刚想到使用 RAMdisk编译结果1 如何在 Gradle 中使用 RAMdisk？我觉得值得搬家.gradle和 build文件夹到 RAMdisk。最佳答案为了完整起见，以下是我在 Ubu
performance - RAMdisk 比磁盘慢？
我创建的一个 python 程序是 IO 有界的。大部分时间(超过 90%)都花在一个重复约 10,000 次的循环中。在这个循环中，生成~100KB 的数据并写入临时文件；然后由另一个程序读出并统计
c++ - 带有文件镜像的 ramdisk
我想加快编译速度，所以我想我可以在 ramdisk 上构建我的文件，但也可以将它自动刷新到文件系统，并在没有足够 ram 的情况下使用文件系统。对于我正在编写的应用程序，我可能需要类似的东西，我希望
Android:Emulator -ramdisk 命令行选项损坏
在尝试跟随 Tweaking the Android Emulator 时要在模拟器上本地包含 Scala 库，我无法加载自定义 ramdisk 镜像。似乎忽略了 emulator -ramdisk
在虚拟 ramdisk 中创建 mmap
如何使用 mmap 在虚拟 ramdisk 中保留内存？假设我愿意: mkdir /mnt/ramdisk mount -t tmpfs -o size=10m tmpfs /mnt/ramdisk
linux - 在 RAMDisk 上执行二进制文件是否会将可执行文件重新加载到内存中？
假设我有两个相同的 10MB 二进制可执行文件副本，A 和 B。如果我有足够的可用内存并运行 ./A，我的理解是 A 将被加载到内存中并从那里运行。这将需要大约 10MB 的 RAM 才能完成。如
linux - 在构建期间生成 ramdisk 并填充内容
是否可以通过某种方式在不安装 ramdisk 的情况下创建并使用文件填充 ramdisk 镜像？我有一套为 linux 定制的文件(所以，只是一堆文件)，它们应该在文件系统中。现在我想让它在生成 r
linux - 如何将文件保存到 ramdisk 文件系统中的闪存？
我是文件系统的新手，我想问一下，有没有什么方法可以使用 ram 磁盘文件系统将我的文件保存到辅助内存？最佳答案如果你想在 ramdisk 文件系统中保存任何文件，你必须将你的文件系统分区链接到根文
build - 在构建服务器上使用 ramdisk 是否明智？
在我的公司，我们目前正在研究加快 CI 构建速度的各种策略。我们已经分析了我们的构建，并确定我们受到 I/O 瓶颈的限制。在不久的将来(约 1-2 个月)，我们有很多选择来解决这个问题，但我们真的希望
embedded - Initrd、Ramdisk、Initramfs、uclinux
我正在coldfire板M5272C3上进行uclinux移植。现在我有从 RAM 运行的内核，并使用 romfs 作为我的根文件系统。我不清楚一些术语的含义以及何时使用它们...... 请用最简单的
docker-compose + 如何设置 ramdisk 而不是卷
在 docker-compose 中，我们设置了以下卷: volumes: - /var/kafka-data:/var/lib/kafka/data 所以/var/kafka-data将从 /v
linux-kernel - 为什么内核的加载地址，ramdisk 在启动时很重要？
我正在处理 android boot.img，它是压缩内核、ramdisk 和 dtb 的组合。我从 uboot 的串行控制台日志中看到有关启动过程的信息，这是触发我好奇心的部分 CPU: Fre
mysql - 在 RAMDisk 上运行 MySQL
我正在加速使用 MySQL 进行持久性测试的测试套件。我已经更改了 my.cnf 中的 datadir 和 tmpdir 以使用 RAMDisk，如下所示。 datadir = /ru
linux - 在 ramdisk 上缓存 - 查找要删除的最旧文件
我在 Linux 中有一个很好的缓存系统，它使用 ramdisk 来缓存图像文件和我网站各个页面的 HTML 输出。我的网站相当大，缓存所有内容所需的 ramdisk 空间超过 15GB(不包括图像
linux - Linux 下小型 ramdisk 最好的文件系统是什么？
我正在使用的嵌入式 Linux 系统有一个 4MB 的 ram 磁盘。目前使用 ext2 格式化。似乎即使是空的，也只有大约 50% 的可用空间! 目前，它用于大约 50 个小文件(1 或 2KB)，
hadoop - RAMdisk 中的 HBase 速度较慢
我有一个关于将 Apache HBase 与 RAMdisk 一起使用的一般性问题。单个表中有大量数据集合，总共约 25GB。有了这些数据，我正在使用 Java 程序进行一些基本的聚合。因为我有足够
RAMdisk 上的 MySQL 内存引擎与 InnoDB
我正在编写一些软件，需要将数据从分层格式扁平化为表格格式。我不想每次都用一种编程语言来完成并提供服务，而是想将结果缓存几秒钟，然后使用 SQL 进行排序和过滤。在使用时，我们说的是在那几秒钟内进行 4
保存在 ramdisk 中的 php session
我正在尝试将我的 php session 保存在 ramdisk 上。我有权限问题，但我看不出问题出在哪里。我有虚拟磁盘: /dev/ram0 407M 2.4M 404M 1%/var/lib/p
android - 如何在启动前在 Android 中挂载 ramdisk？
是否可以在 Android 框架启动之前，但在底层 Linux 内核启动之后，在 Android 中挂载 ramdisk？如果是这样，我应该使用什么命令？谢谢! 最佳答案根据我看过的一些引用书，一

首页

博学

6Ren·AI

商城

hadoop - RAMdisk 中的 HBase 速度较慢