java - Hbase读取性能异常变化-6ren

java - Hbase读取性能异常变化

转载作者：行者123 更新时间：2023-12-01 14:52:11

27

4

我已经安装了 HBase 0.94.0。我必须通过扫描来提高我的阅读性能。我随机插入了 100000 条记录。

当我设置 setCache(100); 时，100000 条记录的性能为 16 秒。

当我将其设置为 setCache(50) 时，100000 条记录的性能为 90 秒。

当我将其设置为 setCache(10); 时，我的性能为 16 秒，处理 100000 条记录

public class Test {
    public static void main(String[] args) {

    long start, middle, end;

    HTableDescriptor descriptor = new HTableDescriptor("Student7");
    descriptor.addFamily(new HColumnDescriptor("No"));
    descriptor.addFamily(new HColumnDescriptor("Subject"));

    try {   
    HBaseConfiguration config = new HBaseConfiguration();
    HBaseAdmin admin = new HBaseAdmin(config);

    admin.createTable(descriptor);
            HTable table = new HTable(config, "Student7");
            System.out.println("Table created !");

    start = System.currentTimeMillis();

    for(int i =1;i<100000;i++) {
        String s=Integer.toString(i);
        Put p = new Put(Bytes.toBytes(s));
        p.add(Bytes.toBytes("No"), Bytes.toBytes("IDCARD"),Bytes.toBytes("i+10"));
        p.add(Bytes.toBytes("No"), Bytes.toBytes("PHONE"),Bytes.toBytes("i+20"));
        p.add(Bytes.toBytes("No"), Bytes.toBytes("PAN"),Bytes.toBytes("i+30"));
        p.add(Bytes.toBytes("No"), Bytes.toBytes("ACCT"),Bytes.toBytes("i+40"));
        p.add(Bytes.toBytes("Subject"), Bytes.toBytes("English"),Bytes.toBytes("50"));
        p.add(Bytes.toBytes("Subject"), Bytes.toBytes("Science"),Bytes.toBytes("60"));
        p.add(Bytes.toBytes("Subject"), Bytes.toBytes("History"),Bytes.toBytes("70"));

        table.put(p);
    }
    middle = System.currentTimeMillis();

    Scan s = new Scan();
    s.setCaching(100);      
    ResultScanner scanner = table.getScanner(s);

    try {
        for (Result rr = scanner.next(); rr != null; rr=scanner.next()) {
            System.out.println("Found row: " + rr);
        }
        end = System.currentTimeMillis(); 
    } finally {
        scanner.close();
    }       
        System.out.println("TableCreation-Time: " + (middle - start));
        System.out.println("Scan-Time: " + (middle - end));
    } catch (IOException e) {
        System.out.println("IOError: cannot create Table.");
        e.printStackTrace();
        }
    }
}

为什么会发生这种情况？

最佳答案

为什么要返回 100000 条记录表中的每条记录？你正在做一个完整的表扫描就像在任何大型数据库中一样，速度很慢。

尝试考虑一个更有用的用例，在该用例中您希望返回一条记录或一系列记录的某些列。

HBase 在其表上只有一个索引，即行键。利用这一点。尝试定义您的行键，以便您只需指定行键即可获取所需的数据。

假设您想知道带有 a 的行的 Subject:History 值row key 介于 80000 和 80100 之间。(请注意，setCaching(100) 意味着 HBase 将在每个 RPC 中获取 100 条记录，这种情况就是这样。与获取相比，获取 100 行显然需要更多内存，比方说，一行。在大型多用户环境中请记住这一点。)

Long start, end;
start = System.currentTimeMillis();

Scan s = new Scan(String.valueOf(80000).getBytes(), String.valueOf(80100).getBytes());
s.setCaching(100);
s.addColumn("Subject".getBytes(), "History".getBytes());

ResultScanner scanner = table.getScanner(s);
try {
    for (Result rr = scanner.next(); rr != null; rr=scanner.next()) {
        System.out.println("Found row: " + new String(rr.getRow(), "UTF-8") + " value: " + new String(rr.getValue("Subject".getBytes(), "History".getBytes()), "UTF-8")));
    }
    end = System.currentTimeMillis(); 
} finally {
    scanner.close();
}       
System.out.println("Scan: " + (end - start));

这可能看起来很愚蠢，因为您如何仅通过整数知道需要哪些行？嗯，确实如此，但这就是为什么您需要根据要查询的内容设计行键，而不是像在传统数据库中那样仅使用增量值。

试试这个例子。应该很快。

注意:我没有运行该示例。我刚刚在这里输入的。也许有一些小的语法错误你应该纠正，但我希望这个想法是清楚的。

关于java - Hbase读取性能异常变化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14729779/

27

4

0

文章推荐： java - 玩!验证不起作用

文章推荐： java - 将模型类添加到通用列表会引发错误

java - 背景随着淡入淡出而过渡/变化
嘿伙计们。实现背景变化(基本上是幻灯片放映)和过渡效果的常见方法有哪些。我想每隔一段时间改变complte文档背景。我是一名 ASP.net 开发人员，并且希望大部分内容都可以在 ASP 中实现。
c++ - 指针随时间的改进/变化？
也许，指针已经在修改过程中指向 auto_ptr 的常规指针指向 unique_ptr 和 shared_ptr 我只是想知道已经开发出来的新型指针是否完全覆盖了旧版本(或者您可能认为存在内存泄漏问题
Android Fragments 变化
我使用 Android Studio 构建 Android 应用。我的问题是:当 fragment 改变时，应用程序崩溃。控制台输出[控制台] 01-06 18:35:21.952 27756-
javascript - 将鼠标悬停在表行上时如何放大表行？ - 变化
****澄清**我做了这个 [Fiddle] ( http://jsfiddle.net/sggPv/10/ ) 来帮助澄清情况。该脚本起初适用于两个表格，但随后当您点击 slider 并将新表格加
html - float 变化
我有图标，单击它会将新的 div(列)添加到 div 容器。问题是，当新的 div(列)出现时，按钮不会向右移动。是否可以以某种方式仅在 div 内添加 position:fixed？这是我的几个屏
Java编译时接口(interface)变化
我是 Java 新手，继承了现有的 Android 应用程序。原始开发人员选择使用常量接口(interface)。我的问题是我需要更改其中一些常量来编译生产应用程序与开发应用程序。如果我手动修改一些
iOS10 UIColor 变化
在 Apple developer Document 中，我在 UIColor 中发现了一些新东西。 If your app was linked on or after iOS 10 and whe
iphone - ShareKit 变化？
我没有经常使用 ShareKit，但我只想拥有三个共享选项:Facebook、Twitter 和电子邮件。 ShareKit 提供了更多选项，包括更多按钮。但是，我不想要“更多”选项，只想要三个。在
javascript - 高效检测单页应用中的 DOM 变化
我正在构建一个 JS 库，其中一个用例要求我在 DOM 更改时触发一个事件，特别是如果它是一个单页应用程序，例如:github search bar 经过一番研究，我遇到了MutationObserv
Excel 检测并跟踪任何工作表中的(值)变化
我已经设法编写了一个代码来检测任何工作表中特定单元格的值变化，但我一直在努力构建检测和跟踪范围(值)变化的东西。例如，如果用户决定复制和粘贴某个范围的数据(假设超过 1 个单元格)，它不会被宏捕获。
audio - 复杂的音频音量随 ffmpeg 变化
使用 ffmpeg ，我们可以对音频电平进行多少控制？例如，我想在程序的时间轴上映射一个“M”形: t0 - t1 : fade in from 0 to 1 t1 - t2 : play at fu
IE8 中的 jQuery on() 变化
使用 jQuery 1.7.1，我尝试为下拉列表上的更改事件创建一个事件处理程序。下拉列表会动态添加到 DOM 中。似乎在大多数浏览器上都能很好地工作，但是哦，奇怪的 IE8 想要变得困难。有解决方法
delphi - 调整非客户区大小后如何反射(reflect)变化？
我想制作一个具有可选边框大小的自定义控件。请参阅下面的代码。边框绘制在非客户区，其宽度可以是 0、1 或 2 像素。我已经在 WM_NCPAINT 中成功完成了边框绘制。问题是，在更改控制边框大小的属
javascript - 检测 URL 变化
我知道这个问题之前已经被问过，而且我实际上已经找到了一些我已经实现的解决方案。不幸的是，我没能得到我想要的。我以前没有做过AngularJS，我想做的是: 检测网址何时更改根据网址更改的内容进行一
AngularJS 观察 DOM 变化
我有一个 auto-carousel 指令，它循环访问链接元素的子元素。但是，子级尚未加载到 DOM 中，因为它们的 ng-if 表达式尚未解析。如何确保父指令知道其 DOM 树已发生更改？
android - 如何观察协程流的 ContentProvider 变化
我有一个流程可以通过内容提供商从数据库中获取数据。 fun getDataFlow(): Flow { return flow { emit(Result.Loading)
javascript - 文本随动画 jquery 变化
我有一些有效的代码，但有时它只是“跳转”到其他文本而不考虑间隔。该代码基本上按时间间隔更改标题的文本。 var text = ["text1", "text2", "text3","text4","
android - 如何监听 SwitchPreferenceCompat 变化
我正在尝试将 onCLick 监听器添加到我的 PreferenceScreen 上的开关，但它不起作用。我尝试了 Java 教程中的代码并将其转换为 Kotlin，但由于某种原因它无法正常工作。这
build - 升级ffmpeg时处理ffmpeg库接口(interface)变化
我们目前正在尝试升级我们的程序使用的 ffmpeg 版本。跳跃很大，因为我们目前使用的是 ffmpeg 0.8，最新版本是 1.2。在这些测试中，我使用的是(让我说)我发现的令人惊叹的软件包 her
android - 如何观察协程流的 ContentProvider 变化
我有一个流程可以通过内容提供商从数据库中获取数据。 fun getDataFlow(): Flow { return flow { emit(Result.Loading)

首页

博学

6Ren·AI

商城

java - Hbase读取性能异常变化