gpt4 book ai didi

sorting - 在 Hadoop(单节点集群)上运行排序示例

转载 作者:行者123 更新时间:2023-12-02 20:14:23 25 4
gpt4 key购买 nike

我已经安装了Hadoop single-node cluster 0.20.2 在 Ubuntu 10.04 并使用我在此站点上找到的教程 Material 运行示例:

http://www.dscripts.net/wiki/setup-hadoop-ubuntu-single-node

现在我正在尝试运行 Sort example在 Hadoop 上。它需要顺序文件作为输入。有人可以请helprunning the Sort example ? (或者给我一些关于如何生成顺序文件作为输入的更多信息)。

先感谢您.. ;-)

最佳答案

Running Sort Benchmark

要将排序示例用作基准,请使用 RandomWriter 生成 10GB/节点的随机数据。然后使用排序示例对数据进行排序。这提供了一个排序基准,可以根据集群的大小进行扩展。默认情况下,排序示例使用 1.0 * 容量作为减少的数量,根据您的集群,您可能会在 1.75 * 容量时看到更好的结果。

命令是:

$> bin/hadoop jar hadoop-*-examples.jar randomwriter /path/randFiles
$> bin/hadoop jar hadoop-*-examples.jar sort /path/randFiles /path/resultFile

第一个命令将在 rand 目录中生成未排序的数据。第二个命令将读取该数据,对其进行排序,然后写入 rand-sort 目录。

关于sorting - 在 Hadoop(单节点集群)上运行排序示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5501157/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com