- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用CDH4运行一个简单的MR作业。我收到最奇怪的错误,我也不知道为什么。基本上,我的程序读取一个文件,使用一个标识映射器,然后reducer仅仅为该值发出一个键和一个字符串。我不明白为什么我的脚本无法正常工作。我在CDH3中从未遇到过这样的问题。任何建议都很好
错误:
14/03/26 20:35:45 INFO mapred.JobClient: Task Id : attempt_201403171159_0109_m_000002_2, Status : FAILED
java.lang.NumberFormatException: For input string: "256MB"
at java.lang.NumberFormatException.forInputString(NumberFormatException.java:65)
at java.lang.Integer.parseInt(Integer.java:492)
at java.lang.Integer.parseInt(Integer.java:527)
at org.apache.hadoop.conf.Configuration.getInt(Configuration.java:1060)
at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.init(MapTask.java:809)
at org.apache.hadoop.mapred.MapTask.createSortingCollector(MapTask.java:376)
at org.apache.hadoop.mapred.MapTask.access$100(MapTask.java:85)
at org.apache.hadoop.mapred.MapTask$NewOutputCollector.<init>(MapTask.java:584)
at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:656)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:330)
at org.apache.hadoop.mapred.Child$4.run(Child.java:268)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:415)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1408)
at org.apache.hadoop
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-core</artifactId>
<version>2.0.0-mr1-cdh4.4.0</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>2.0.0-cdh4.4.0</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-tools</artifactId>
<version>2.0.0-mr1-cdh4.4.0</version>
</dependency>
<repositories>
<repository>
<id>cloudera</id>
<url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
</repository>
<repository>
<id>maven-hadoop</id>
<name>Hadoop Releases</name>
<url>https://repository.cloudera.com/content/repositories/releases/</url>
</repository>
</repositories>
package com.some.packagename;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;
public class MyMRJob extends Configured implements Tool {
private static String inputPath = "someHDFSInputPath";
private static String outputPath = "someHDFSOutputPath";
public static void main(String[] args) throws Exception {
Configuration conf = new Configuration();
conf.set("mapred.job.tracker", "jtserver:8021");
conf.set("fs.defaultFS", "hdfs://nnserver:8020");
ToolRunner.run(conf, new MyMRJob(), args);
}
public final int run(final String[] args) throws Exception {
// Initialize
Job job = new Job(super.getConf(),MyMRJob.class.getSimpleName());
// General Configs
job.setJarByClass(MyMRJob.class);
// Inputs
TextInputFormat.setInputPaths(job, inputPath);
job.setInputFormatClass(TextInputFormat.class);
// Mapper
job.setMapperClass(TheMapper.class);
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(Text.class);
// Reducer
job.setReducerClass(TheReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Text.class);
// Output
TextOutputFormat.setOutputPath(job, new Path(outputPath));
job.setOutputFormatClass(TextOutputFormat .class);
// Run the job
boolean b = job.waitForCompletion(true);
if (!b)
throw new IOException("Error with the job - it has failed!");
return 1;
}
private static class TheMapper extends Mapper<Text, Text, Text, Text> {
protected void map(Text key, Text value, Context context) throws IOException, InterruptedException {
context.write(key, value);
}
}
public static class TheReducer extends Reducer<Text, Text, Text, Text> {
public void reduce(Text key, Iterable<Text> values, Context context) throws IOException, InterruptedException {
context.write(key, new Text("some value"));
}
}
}
最佳答案
看看你的
mapred-site.xml
mapred.child.java.opts and io.sort.mb
关于maven - 在CDH4上运行简单的MR作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22676067/
我正在使用 grep 将“先生”和“夫人”替换为“先生”。和“夫人”,但每当我输入 gsub("Mr", "Mr.", data$Title) 它还会导致所有“夫人”变成“先生”,这不完全是我正在寻找
我在一台远程机器(四核超线程)上安装了 Hadoop 1.2.1,并且正在用 1GB 的文件(一个文件,未压缩)测试 MR 的性能 当我将拆分大小设置为大约 250MB 时,我有四个映射器。在输出文件
我正在尝试了解 MR 作业经历的各个阶段。我阅读了相同的在线文档。 据此,我对序列的理解如下: map() -> Partitioner -> Sorting (mapper machine) ->
我在HDFS中的数据上运行三种不同类型的作业。 在当前情况下,这三个作业必须分别运行。 现在,we want to run the three jobs together by piping the
我有几个 MR-3020,我用 OpenWRT 刷过,并在上面安装了一个 16GB ext4 USB 驱动器。启动时,将启动一个守护进程 shell 脚本,它会做两件事: 1) 它不断查看我的主程序是
我有 9 个文件,每个文件的大小都等于集群的 BlockLength,存储在 hadoop 中。我需要获取文件所在的数据节点的地址。复制因子为 3 。 是否有任何 hadoop API 可以执行此操作
我是 HIVE 和 HADOOP 的新手,在这里我试图在 hive 中加入两个示例表,其中表没有任何主外键关系只是为了练习:- 表格如下 Employees table:-
据我所知,在将文件复制到 HDFS 时进行文件拆分和在文件上为映射器输入进行输入拆分是完全两种不同的方法。 这是我的问题-- 假设我的 File1 大小是 128MB,它被分成两个 block 并存储
我是 Hadoop 的新手,这是我的第一个映射器程序,我正在通过 MR 单元对其进行单元测试。 我正在传递我通过配置对象设置的参数(年份) Configuration config =new
我使用 Sqoop、Hive 和 Pig 操作创建了一个简单的 Oozie 工作流。对于其中的每一个 Action ,Oozie 都会启动一个 MR 启动器,然后由它启动 Action (Sqoop/
我正在运行 MR ( myrepos ) 并尝试运行全局配置。我曾尝试使用 .mrconfig 中的 DEFAULT 部分,但无济于事: [DEFAULT] clean = git clean -df
我们都知道kloxo这个国外非常著名的开源的服务器管理系统,虽然kloxo在国内使用起来会遇到不少的问题,但是由于kloxo可以与whmcs等整合,还是得到了不少朋友的喜爱。本文要介绍的klox
本文整理了Java中org.elasticsearch.hadoop.mr.WritableValueWriter类的一些代码示例,展示了WritableValueWriter类的具体用法。这些代码示
Create PROCEDURE [dbo].[K_RT_FixedAsset] @fromdate datetime, @todate datetime AS BEGIN SET NOCOUNT O
我正在尝试在Hadoop集群上运行MR作业。一旦尝试成功,但是从昨天开始,我将无法运行同一命令,因为它找不到输入路径 这是跟踪: [esb99usr@SBT-IPO-078 ~]$ yarn jar
我正在尝试通过独立的HBase(0.94.11)执行MR代码。 我已经阅读了HBase api,并修改了MR代码以读取数据并向HBase表写入结果,并且在reduce阶段遇到异常。提供部分代码(不包括
我创建了一个正则表达式,可以提取包含匹配单词的句子。 [^.|?|!]*\[^.|!|?]*[\"!?:\.] 但是,它不适用于句子中含有先生/夫人/博士等的情况。 例如: The adventure
我是 MRJob 和 MR 的新手,我想知道 MRJob MR 的传统字数统计 python 示例: from mrjob.job import MRJob class MRWordCounter(M
我试图编写正则表达式来识别以开头的名称 Mr.|Mrs. 例如 Mr. A, Mrs. B. 我尝试了几种表达方式。这些正则表达式已在在线工具 pythonregex.com 上进行检查。 。使用的测
我知道这可能非常简单或其他什么,但最近几个小时我一直在思考这个问题。我搞不清楚了。我有一个看起来像这样的集合(每个文档结构都是相同的) { "_id": "736722976", "val
我是一名优秀的程序员,十分优秀!