java - 当我试图将整个文件夹作为 Mapreduce 程序的输入时，我正面临 "Java heap space error"-6ren

java - 当我试图将整个文件夹作为 Mapreduce 程序的输入时，我正面临 "Java heap space error"

转载作者：可可西里更新时间：2023-11-01 14:58:23

25

4

当我尝试通过将整个文件夹作为 MR 作业的输入来运行 mapreduce 程序时，我遇到了“Java 堆空间错误”。当我将单个文件作为 MR 作业的输入时，我没有遇到任何错误。作业已成功运行。

Changes I tried in hadoop-env.sh file:
=====================================
I had increased the memory size from 1024 to 2048MB
export HADOOP_CLIENT_OPTS="-Xmx2048m $HADOOP_CLIENT_OPTS"

Changes in mapred-site.xml:
===========================
<property>
  <name>mapred.child.java.opts</name>
  <value>-Xmx2048m</value>
</property>

通过对这些文件进行更改，我仍然面临“Java 堆空间错误”。

任何人都可以就这个问题向我提出建议......

最佳答案

你可以用这样的东西为你的工作打开 HPROF 分析，

conf.setBoolean("mapred.task.profile", true);conf.set("mapred.task.profile.params", "-agentlib:hprof=cpu=samples,"+ "heap=sites,depth=6,force=n,thread=y,verbose=n,file=%s");conf.set("mapred.task.profile.maps", "0-2");conf.set("mapred.task.profile.reduces", "0-2");

这将帮助您诊断耗尽堆的原因。请参阅“Hadoop 权威指南”第 178-181 页中的更多详细信息。

关于java - 当我试图将整个文件夹作为 Mapreduce 程序的输入时，我正面临 "Java heap space error"，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29889715/

25

4

0

文章推荐： javascript - Jquery 将用户定向到特定的 anchor 标记

文章推荐： HTML 5 视频问题

文章推荐： javascript - 如何根据用户选择显示/排序特定的 div

文章推荐： java - 具有多个输出的 FileAlreadyExistsException

java - 当用户选择停止时，如何打印用户的赢、输、平数
此时，程序显示两种选择并打印一条语句，表明用户赢了、计算机赢了还是平局。继续玩直到用户选择停止，然后打印用户赢的次数，损失, 和关系. import java.util.Scanner; import
d3.js 条形图，每条记录带有正负条(赢/输)
我想在 d3.js 中制作一个条形图，每个项目或行都有正条和负条，如下所示: 它有点像谷歌金融“行业摘要”图表(http://google.com/finance) 任何人都可以指出我这种图表的 d3
python - 目标和目标我想返回结果(赢、平、输)。 Pandas python
尝试根据 GF 和 GA 创建一个新列“Results”。想知道如何通过定义函数和条件语句来做到这一点。以下是我对一行的初步尝试，但无法弄清楚如何将其应用于所有行，非常感谢您的帮助! 日期地点对手GF
java - 如何使用 boolean 函数和数组计算和显示 Java 中两个不同团队的赢/输
我对 Java 还很陌生，并且有一项任务被困住了。我相信我的 boolean 函数是正确的，但是我不知道在主函数中要写什么。这是作业: 编写一个公共(public)函数(静态方法)winner(in
java - 计算掷骰子游戏中 10,000 次模拟的获胜概率(赢/(赢 + 输))。这是作业的一部分
使用掷骰子游戏中的 10,000 次模拟来计算获胜概率 (wins/(wins + Loss))。下面是双骰子游戏的方法: public class CrapsGame { public st

首页

博学

6Ren·AI

商城

java - 当我试图将整个文件夹作为 Mapreduce 程序的输入时，我正面临 "Java heap space error"