Hadoop conf确定num map任务-6ren

Hadoop conf确定num map任务

转载作者：可可西里更新时间：2023-11-01 15:39:55

27

4

我有一份工作，就像我所有的 Hadoop 工作一样，从我在 Hadoop 界面中看到的运行时，它似乎总共有 2 个 map task 。但是，这意味着它加载了太多数据，以至于我收到 Java 堆空间错误。

我已经尝试在我的 Hadoop 集群中设置许多不同的 conf 属性来将作业拆分为更多任务，但似乎没有任何效果。

我试过设置mapreduce.input.fileinputformat.split.maxsize、mapred.max.split.size、dfs.block.size 但似乎没有任何效果。

我正在使用 0.20.2-cdh3u6，并尝试使用 cascading.jdbc 运行作业 - 该作业无法从数据库读取数据。我认为这个问题可以通过增加拆分次数来解决，但不知道该怎么做!

求助!快疯了!

2013-07-23 09:12:15,747 FATAL org.apache.hadoop.mapred.Child: Error running child : java.lang.OutOfMemoryError: Java heap space
        at com.mysql.jdbc.Buffer.<init>(Buffer.java:59)
        at com.mysql.jdbc.MysqlIO.nextRow(MysqlIO.java:1477)
        at com.mysql.jdbc.MysqlIO.readSingleRowSet(MysqlIO.java:2936)
        at com.mysql.jdbc.MysqlIO.getResultSet(MysqlIO.java:477)
        at com.mysql.jdbc.MysqlIO.readResultsForQueryOrUpdate(MysqlIO.java:2631)
        at com.mysql.jdbc.MysqlIO.readAllResults(MysqlIO.java:1800)
        at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2221)
        at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2618)
        at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2568)
        at com.mysql.jdbc.StatementImpl.executeQuery(StatementImpl.java:1557)
        at cascading.jdbc.db.DBInputFormat$DBRecordReader.<init>(DBInputFormat.java:97)
        at cascading.jdbc.db.DBInputFormat.getRecordReader(DBInputFormat.java:376)
        at cascading.tap.hadoop.MultiInputFormat$1.operate(MultiInputFormat.java:282)
        at cascading.tap.hadoop.MultiInputFormat$1.operate(MultiInputFormat.java:277)
        at cascading.util.Util.retry(Util.java:624)
        at cascading.tap.hadoop.MultiInputFormat.getRecordReader(MultiInputFormat.java:276)
        at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:370)
        at org.apache.hadoop.mapred.MapTask.run(MapTask.java:324)
        at org.apache.hadoop.mapred.Child$4.run(Child.java:266)
        at java.security.AccessController.doPrivileged(Native Method)
        at javax.security.auth.Subject.doAs(Subject.java:415)
        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1278)
        at org.apache.hadoop.mapred.Child.main(Child.java:260)

最佳答案

你应该看看内存管理的设置，比如 io.sort.mb 或 mapred.cluster.map.memory.mb 因为堆空间错误通常是由于一个分配问题而不是映射号。

如果你想强制你的 map 编号，你必须考虑到一些值先于其他值使用。例如，如果 mapreduce.input.fileinputformat.split.maxsize 很小，即使您将 mapred.tasktracker.map.tasks.maximum 设置得很小，也会产生大量任务值(value)。

只有当 dfs.block.size 大于 mapreduce.input.fileinputformat.split.maxsize

时，它才会影响生成的 map 数量

关于Hadoop conf确定num map任务，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17810368/

27

4

0

文章推荐： c++ - 调用不带 <> 的模板函数；类型推断

文章推荐： c++ - Direct3D 是否应该用于 Windows 中的 OpenGL？

文章推荐： c++ - 当缓冲区缩小时，是否保证 realloc 就位？

文章推荐： c++ - 在Matlab、C++等中将数学公式转换成代码的方法？

regex - 用于查找此格式数字 num :num:num:num 的数字的正则表达式
我知道这是基本的，但我不确定，我哪里出错了，之前从未写过正则表达式.. 我需要从命令中获取一些输出 cmd | grep '[0-9]+:[0-9]+:[0-9]+:[0-9]+' 我需要grep一些
python - nums[:] = nums[::-1] 和 nums = nums[::-1] 之间的区别
这个问题在这里已经有了答案: How does assignment work with list slices? [duplicate] (5 个答案) What does colon at as
c - 给定 `int num[7]` ， `num` 、 `&num[0]` 、 `&num` 有何不同？
我在一本 C 书中读到，对于数组 num[7]，术语 num 等同于 &num[0]。这个概念对我来说很好，但是当我编写如下所示的程序时，我再次感到困惑。 #include #include int
haskell - 在 Haskell 中，有没有写 num to num 转换函数 `toNum::(Num a, Num b) => a -> b` 的好方法？
例如，一种不好的方法是通过字符串分解: toReadableNum :: (Num a, Num b, Read b) => a -> b toReadableNum = read . show 如果
javascript - AngularJS 2 中的 #num、[(ngModel)] ="num"和 [value] ="num"之间选择什么
在输入文本字段中，我必须获取该值并在我的 .ts 文件中使用它。你能建议我应该使用以下哪种语法吗？最佳答案如果您希望在文本字段中看到的内容与变量中看到的内容之间进行同步对齐，请使用如果您想在文
c# - 在 c# 中使用 while 循环，在两个 num 之间计数，仅打印可被第三个 num 整除的 num
我正在研究 while 循环。我目前正在研究一个问题，要求从名为 a、b 和 c 的用户那里获取三个数字。我尝试显示 a 和 b 之间的所有数字，它们除以 c。我尝试使用“if”的想法，但没有成功。
javascript - "num & 8"、 "num >> 8"和 "num >> 8 & 64"在 javascript 中是什么意思？
因为这些符号，我很难用谷歌搜索。 num & 8, num >> 8 和 num >> 8 & 64 在 javascript 中是什么意思？最佳答案它们是 bitwise operators 关
Haskell: `Num [a] => a`和 `Num a => [a]`有什么区别
显然，我的类型签名已关闭。从那以后我发现了原因。现在，我有兴趣了解更多关于我的错字上的 GHCI 推断签名。我试图让这段代码工作: elemNum :: (Eq a, Num b) => a -> [
C++程序根据特定规则接受一个字符串(num opr num)
我有一个程序根据定义的规则接受特定的字符串，即数字运算符编号。例如:2+4-5*9/8 上面的字符串是可以接受的。现在，当我输入类似 2+4-a 的内容时，它再次显示可接受，这是完全 Not Acce
java - `nums[nums.length - 1]; ` 是范围还是单个元素？
我读到了这样一个旋转数组的解决方案问题: public class Solution { public void rotate(int[] nums, int k) { in
c++ - num++ 可以是 'int num' 的原子吗？
一般来说，对于 int num , num++ (或 ++num )，作为读-修改-写操作，是不是原子的 .但是我经常看到编译器，比如GCC ，为其生成以下代码( try here ): void
regex - Perl:($num) 和 $num 之间的区别
这个问题在这里已经有了答案: What's the difference between my ($variableName) and my $variableName in Perl? (4 个回答
python - 根据 num 条件返回 nums 列表
如果列表中的 num 大于 0.5，我想得到 1，否则得到 0。例如，a是一个列表 Matlab: b = (a > 0.5) Python: b = [1 if x > 0.5 else 0 fo
python - "num - 1"与 "num -= 1"
第4行为什么要在“-”后面加上“=”？ num = 5 if num > 2: print(num) num -= 1 print(num) 最佳答案 num - 1:产生num减一的
Elixir，num = [9]，num 被分配给 '\t'
iex> num = [9] '\t' 分配单个 [9] 列表返回 '\t'。这是什么原因？最佳答案您可以使用 i helper in IEx有关数据类型的更多信息: iex> i [9] Te
perl - Moose - 从 Num 强制转换为 ArrayRef[Num]？
好吧，我做错了什么 - Moose 忽略了我的强制: package moo; use Moose; use Moose::Util::TypeConstraints; subtype Bar =>
javascript - c[num] 和 c.num 一样吗
这个问题已经有答案了: JavaScript property access: dot notation vs. brackets? (17 个回答) 已关闭 4 年前。我正在练习编写一些代码。在练
mysql - 如何为语句 SELECT COUNT(*) as num... 编写子句 : WHERE num =. ..？
我有声明 SELECT COUNT(*) as num_requests, ip_address FROM requests GROUP BY ip_address ORDER BY num_requ
(num>0) 的 Javascript 短缺？num :0
有什么方法可以在 javascript 中编写更短的 (num>0)?num:0 吗？原因是 num 变量还没有定义，在上面的例子中需要计算两次。换句话说，a和b是已知的。我想写 (a>b)?(a
javascript - 在 JavaScript 中，为什么 num == [num]？
这个问题在这里已经有了答案: Why does 2 == [2] in JavaScript? (9 个回答) 关闭 9 年前。这些陈述的计算结果为真是否有原因？ 0 == [0]; 1 == [

首页

博学

6Ren·AI

商城

Hadoop conf确定num map任务