hadoop - 为什么使用 MapReduce 与 HBase shell 过滤器-6ren

hadoop - 为什么使用 MapReduce 与 HBase shell 过滤器

转载作者：可可西里更新时间：2023-11-01 15:11:15

26

4

我需要在HBase上查询数据。我的查询如下所示:

显示“authorD”的所有书籍。
数据库中有多少作者“authorA”的书？

据我所知，您可以使用 MapReduce 或 HBase 外壳过滤器来做到这一点。如果我错了，请纠正我。

我的问题是:如果我可以使用它的过滤器在 HBase shell 上执行相同的操作(无需编程)，我为什么要使用 MapReduce(需要编程)？

感谢您的回答。祝你有美好的一天。

最佳答案

有 3 种方法可以从 Hbase 中获取结果。

1) Shell :这是用于对少量数据进行简单可靠的数据分析。这适用于少量数据，供开发人员分析。如果您直接知道您的行键，您可以快速获取数据

2) Hbase 非批处理客户端:例如连接到 Hbase 的 Java 客户端应用过滤器并获取结果这也适用于少量数据。

为什么 mapreduce Hbase API

What happens if your data is huge and you need to process... in that case, Either your hbase shell will hang and it will become un-responsive or continuous flow of data will be there which will be scrolling.. you cant able to see that and analyze..

3) Mapreduce (Batch Client):用于处理大量数据。您可以使用在 Java Hbase 客户端程序中使用的相同过滤器和扫描对象...来获取结果。

将 Mapreduce 与 Hbase 结合使用的优势/原因:

批处理/并行处理
至少结果将作为部分文件存储在 HDFS 中(如果您提到 hdfs 作为接收器)
您可以将例如:临时表的结果聚合到另一个汇总表就像一条 ETL 管道......

One classic examples of the above explanation is counting number of rows...

想一想为什么 hbase 团队已经为 mapreduce 提供了计算行的工作，即使使用 Hbase shell 也可以实现相同的功能...

Mapreduce 方式:

$ hbase org.apache.hadoop.hbase.mapreduce.RowCounter

Usage: RowCounter [options] 
    <tablename> [          
        --starttime=[start] 
        --endtime=[end] 
        [--range=[startKey],[endKey]] 
        [<column1> <column2>...]
    ]

Hbase shell 方式:通过 hbase shell 你也可以这样做

$ count 'hbase table'

我希望现在你会得到答案:-)

关于hadoop - 为什么使用 MapReduce 与 HBase shell 过滤器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38404099/

26

4

0

文章推荐： google-chrome - Chrome 浏览器如何决定何时发送 OPTIONS？

文章推荐： c++ - 使用带有字符串定界符的 boost::tokenizer

文章推荐： api - 自定义授权 header

文章推荐： c++ - 父类中 protected 数据在子类中不可用？

shell - 从子 shell 退出 shell
我相信我在子 shell 中调用 exit 会导致我的程序继续: #!/bin/bash grep str file | while read line do exit 0 done
shell - 从子 shell 退出 shell
我相信我在子 shell 中调用 exit 会导致我的程序继续: #!/bin/bash grep str file | while read line do exit 0 done
shell - 将变量从一个 shell 脚本导出到另一个 shell 脚本
我有几个脚本，它们的第一部分看起来是一样的。这部分的功能是识别脚本在哪台机器上运行并相应地设置几个变量。它看起来像这样: ENV=`echo $LOGNAME | cut -c1-8` if
shell - 从一个 Shell 脚本运行多个 Shell 脚本
这是我正在尝试做的事情。我有 4 个 shell 脚本。脚本 1 需要先运行，然后是 2，然后是 3，然后是 4，并且它们必须按此顺序运行。脚本 1 需要运行(并在后台等待)2 才能正常运行，但是脚本
shell - 捕获从另一个 shell 脚本调用的 shell 脚本的输出
我有一个名为 a.sh 的脚本，其中的内容是: //a.sh: #!/bin/bash temp=0 while [ "$temp" -ne 500 ] do echo `date`
shell - 使用 shell() 执行多个 shell 命令的推荐方法
在snakemake中，使用shell()函数执行多个命令的推荐方式是什么？最佳答案您可以调用shell()多次内run规则块(规则可以指定 run: 而不是 shell: ): rule pro
shell - 将一个 shell 脚本的所有参数传递给另一个 shell 脚本
我有一个 shell 脚本，我向其中传递了一些参数。Test1.sh -a 1 -b 2 -c“一二三” 在 Test1.sh 中，我按以下方式调用另一个 shell 脚本。Test2.sh $* 我
shell - 我可以从另一个 shell 脚本调用一个 shell 脚本的函数吗？
我有 2 个 shell 脚本。第二个shell脚本包含以下函数第二个.sh func1 func2 first.sh 将使用一些参数调用第二个 shell 脚本，将使用特定于该函数的一些其他参数
shell - 从子 shell 运行 shell 命令
我有一个 Unix shell 脚本 test.sh。在脚本中，我想调用另一个 shell，然后从子 shell 执行 shell 脚本中的其余命令并退出说清楚: test.sh #! /bin/b
shell - 在 shell 脚本中更改父 shell 的路径变量
我想在 shell 脚本中更改路径环境变量。路径变量需要在shell脚本执行后修改。最佳答案我知道有两种方法可以做到这一点。第一种是在当前 shell 的上下文中运行脚本: . myscript.
shell - 管道是否保证在任何 POSIX shell 中创建子 shell？
此 shell 脚本按预期运行。 trap 'echo exit' EXIT foo() { exit } echo begin foo echo end 这是输出。 $ sh foo.sh
shell - vim shell 键映射以执行 shell 命令
我正在使用 vimshell在 vim 中执行命令 nnoremap vs :VimShellPop 使用此键映射，我可以打开 vim shell 并执行诸如“捆绑安装”之类的命令，然后输入 exi
linux - shell 内的 shell 脚本 shell
我想连接到不同的 shell(csh、ksh 等)并在每个切换的 shell 中执行命令。下面是反射(reflect)我的意图的示例程序: #!/bin/bash echo $SHELL csh e
shell - shell 运算符的优先级
我目前正在尝试使用 BNF 和 LL 解析器在 C 中重新编写 shell。否则，我需要知道 shell 运算符的优先级是什么| , > , > , & , ; ? 有没有人可以提供给我？谢谢最
shell - 如何使用脚本暂停后台 shell？
不幸的是，我没有suspend 命令(busybox/ash)。但是我可以使用 kill -STOP $$ 从后台 shell (sh &) 返回到父 shell(以及 fg 之后)。但是我不想输入
shell - SWT - 可靠地知道 shell 用户是否切换到另一个 shell 的事件
我需要知道，当用户切换到另一个 shell 时，通过单击它。我试过 shellListener.shellDeactivated()但是当 shell 失去对它自己的控件的焦点时，会触发此事件，这意
shell - (shell) 如何从一个文件中删除可以在另一个文件中找到的字符串？
file1.txt aaaa bbbb cccc dddd eeee file2.txt DDDD cccc aaaa 结果 bbbb eeee 如果能不区分大小写就更好了! 谢谢! 最佳答案 gre
shell - shell 循环可以解压缩目录中的所有文件吗？
我见过解压缩目录中所有 zip 文件的循环。但是，在运行此之前，我宁愿确保我将要运行的内容正常工作: for i in dir; do cd $i; unzip '*.zip'; rm -rf *.z
shell - shell 文本编辑器如何工作？
我对编程还很陌生，但我想知道 vim、emacs、nano 等 shell 文本编辑器如何能够控制命令行窗口。我主要是一名 Windows 程序员，所以可能在 *nix 上有所不同。据我所知，只能将文
shell - 比较文本文件中的日期| shell
我有一个包含第 7 列日期的文件，我的要求是将它与今天的日期进行比较，如果小于它，则删除该完整行。此外，如果第 7 列中提到的任何日期超过 15 天，则将其修改为最多 15 天下面的例子- now

首页

博学

6Ren·AI

商城

hadoop - 为什么使用 MapReduce 与 HBase shell 过滤器