- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我正在使用 apache 提供的基准文件 TestDFSIO 测试我的 hadoop 配置。我正在根据本教程(资源 1)运行它:
测试的用法如下:
TestDFSIO.0.0.4
Usage: hadoop jar $HADOOP_HOME/hadoop-*test*.jar TestDFSIO
-read | -write | -clean
[-nrFiles N] [-fileSize MB]
[-resFile resultFileName] [-bufferSize Bytes]
我对某些标志有点困惑,具体来说,缓冲区大小标志的作用是什么?另外,当作业成功完成时导航 hdfs 时(我首先执行了写入 TestDFSIO) ,我找不到我应该通过选择 resultFileName 创建的文件名。 为什么我用resultFileName找不到文件?
我也看过这个页面(资源 2)(特别是第 25 页):
作为测试参数之一,他们使用的 block 大小为 64MB 和 128MB。我尝试将“64MB”(转换为字节)放在 bufferSize 标志之后,但这导致作业失败,这让我相信我不了解 buffersize 标志的用途,以及如何使用不同的 block 大小进行测试。 如何更改测试的 block 大小(根据资源 2)?
最佳答案
什么是缓冲区大小标志?
缓冲区大小标志以字节为单位描述了写入缓冲区的长度。请参阅 TestDFSIO.java 中的 WriteMapper 构造函数:
public WriteMapper() {
for(int i=0; i < bufferSize; i++)
buffer[i] = (byte)('0' + i % 50);
}
这里,数据在写入磁盘之前生成并写入内存中的缓冲区。后面写到磁盘的时候,都是一步写的,而不是一个字节一步写的。更少的写入通常意味着更好的性能,因此更大的缓冲区可能会提高性能。
为什么我用resultFileName找不到文件?
结果通常会自动写入/benchmarks/TestDFSIO。如果您在那里找不到它,请在您的作业日志中搜索 mapred.output.dir。
如何更改测试的 block 大小(根据资源 2)?
block 大小可以作为参数作为 generic option 传递.尝试类似的东西:
hadoop jar $HADOOP_HOME/hadoop-*test*.jar TestDFSIO -D dfs.block.size=134217728 -write
关于Hadoop 基准 : TestDFSIO,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11856236/
我正在使用 apache 提供的基准文件 TestDFSIO 测试我的 hadoop 配置。我正在根据本教程(资源 1)运行它: http://www.michael-noll.com/blog/20
我设置了一个双节点 hadoop 集群。启动集群后,它看起来像这样: 机器namenode: hadoop@namenode:~$ jps 5691 Jps 3531 DataNode 3424 Na
是否可以以非 hdfs 用户身份执行 TestDFSIO 基准测试?此基准测试试图创建一个/benchmarks 目录,但由于缺少权限而失败。有没有办法让这个基准测试使用我的 hdfs home 来存
我已经在一个双节点集群上安装了 hadoop。第一个节点“namenode”运行以下守护进程: hadoop@namenode:~$ jps 2916 SecondaryNameNode 2692 N
我有一个包含 11 个节点的集群,其中 9 个是从节点,2 个是主节点,与 my previous question 中的相同.我正在这个使用 CDH 5.8.0 的集群上执行 TestDFSIO 基
环境详情: 操作系统:CentOS 7.2CDH:CDH 5.8.0主机:11(2个master,4个DN+NM,5个NM) yarn.nodemanager.resource.memory-mb 3
我是 hadoop 的新手。我想对 hadoop 集群进行压力/性能测试。为此,我按照 Hadoop benchmarking 给出的说明进行操作。 .不同之处在于,在教程中他谈论的是 hadoop
我是一名优秀的程序员,十分优秀!