hadoop - Hive 失败，出现 java.io.IOException(拆分超出最大块位置 .... 拆分大小 : 45 maxsize: 10)-6ren

hadoop - Hive 失败，出现 java.io.IOException(拆分超出最大块位置 .... 拆分大小 : 45 maxsize: 10)

转载作者：可可西里更新时间：2023-11-01 15:39:43

27

4

配置单元确实需要处理 45 个文件。每个大小约为 1GB。映射器执行完成 100% 后，配置单元失败并显示上述错误消息。

Driver returned: 1.  Errors: OK
Hive history file=/tmp/hue/hive_job_log_hue_201308221004_1738621649.txt
Total MapReduce jobs = 3
Launching Job 1 out of 3
Number of reduce tasks is set to 0 since there's no reduce operator
Starting Job = job_1376898282169_0441, Tracking URL = http://SH02SVR2882.hadoop.sh2.ctripcorp.com:8088/proxy/application_1376898282169_0441/
Kill Command = //usr/lib/hadoop/bin/hadoop job  -kill job_1376898282169_0441
Hadoop job information for Stage-1: number of mappers: 236; number of reducers: 0
2013-08-22 10:04:40,205 Stage-1 map = 0%,  reduce = 0%
2013-08-22 10:05:07,486 Stage-1 map = 1%,  reduce = 0%, Cumulative CPU 121.28 sec
.......................
2013-08-22 10:09:18,625 Stage-1 map = 100%,  reduce = 0%, Cumulative CPU 7707.18 sec
MapReduce Total cumulative CPU time: 0 days 2 hours 8 minutes 27 seconds 180 msec
Ended Job = job_1376898282169_0441
Ended Job = -541447549, job is filtered out (removed at runtime).
Ended Job = -1652692814, job is filtered out (removed at runtime).
Launching Job 3 out of 3
Number of reduce tasks is set to 0 since there's no reduce operator
Job Submission failed with exception 
'java.io.IOException(Max block location exceeded for split: Paths:/tmp/hive-beeswax-logging/hive_2013-08-22_10-04-32_755_6427103839442439579/-ext-10001/000009_0:0+28909,....,/tmp/hive-beeswax-logging/hive_2013-08-22_10-04-32_755_6427103839442439579/-ext-10001/000218_0:0+45856 
Locations:10.8.75.17:...:10.8.75.20:; InputFormatClass: org.apache.hadoop.mapred.TextInputFormat
 splitsize: 45 maxsize: 10)'
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.MapRedTask
MapReduce Jobs Launched: 
Job 0: Map: 236   Cumulative CPU: 7707.18 sec   HDFS Read: 63319449229 HDFS Write: 8603165 SUCCESS
Total MapReduce CPU Time Spent: 0 days 2 hours 8 minutes 27 seconds 180 msec

但是我没有设置maxsize。执行了很多次，但得到相同的错误。我试图为配置单元添加 mapreduce.jobtracker.split.metainfo.maxsize 属性。但在这种情况下，hive 在没有任何 map 工作的情况下失败了。

最佳答案

设置 mapreduce.job.max.split.locations > 45

在我们的情况下，它解决了问题。

关于hadoop - Hive 失败，出现 java.io.IOException(拆分超出最大块位置 .... 拆分大小 : 45 maxsize: 10)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18370647/

27

4

0

文章推荐： hadoop - 在phoenix for hbase 中，插入90000 行数据时插入OOM

文章推荐： c++ - OpenCV SURF 功能未实现

文章推荐：具有复合键的 Hadoop 困难

文章推荐： c++ - 是否在前向声明的类型未定义行为上使用 typeid？

c# - 尽管 IOException catch block 引发了 IOException
我们有一个连接到某些网络服务的 Windows 窗体应用程序。它列出了系统中的文档，当用户双击一个文件时，我们将文件下载到本地计算机并打开文档供他们编辑。一旦用户关闭文档，我们就会将其上传回系统。对
java - 为什么在 Java 7 中可以捕获 IOException，即使永远不会抛出 IOException
public class SampleCloseable implements AutoCloseable { private String name; public SampleCl
bash - 遇到 IOException 运行导入作业 : java. io.IOException:javac 返回的错误
我正在尝试使用 JAVA 运行一个简单的 sqoop 导入程序。我的程序: String driver="com.vertica.Driver"; Configuration con
java.io.IOException : Cannot run program "...": java. io.IOException : error=2, 没有那个文件或目录
我需要从 Java 执行一个外部程序(使用 libreoffice 将 fodt 文件转换为 pdf，就这样发生了)我知道该程序所需的精确命令行: /usr/bin/libreoffice --hea
java - 我应该如何使用 `try-with-resources` 中的 IOException 嵌套在 header 中带有`throws IOException`的方法中？
AFAIK，标准try-with-resources 形式 try(InputStream is= new ...){ ... some reading from is } catch (..
java - LOG.error ("IOException: "+ e.getMessage(), e); 有什么区别？和 LOG.error ("IOException: "+e.getMessage());?
我观察到这两种说法都是有效的。与第二个语句相比，第一个语句中记录的额外内容是什么？最佳答案第一个还记录原始异常(和堆栈跟踪)，第二个仅记录消息。因此，第一个语句中记录的“额外内容”是原始异常。这
java.io.IOException : Cannot run program "/usr/bin/sh": java. io.IOException : error=2, 没有那个文件或目录
我想执行重命名和删除功能，环境是LINUX。这是我正在使用的代码， String[] command_ary = { "/usr/bin/sh", "-c", command }; Runtime r
java.io.IOException : Cannot run program "C:\AutoIt\ModenaAutoIt.exe": java. io.IOException : error=2, 没有这样的文件或目录
在使用 selenium webdriver 实现 Web 应用程序的自动化时，我遇到了一种情况，我需要上传文件并进一步继续。我们为此使用 Java 和 Tcl 脚本语言。下面是我的 TCL 代码
linux - ANT 执行失败 : java. io.IOException : Cannot run program "cp ": java. io.IOException : error=2, 没有这样的文件或目录
我正在尝试使用 ANT 将文件从一个目录复制到 Linux 上的另一个目录。首先我使用了复制任务，它工作正常但文件模式没有保留。然后我改为使用，这就是我卡住的地方。我的目标是这样的:
hadoop - (Sqoop-import) 错误 tool.ImportTool : Encountered IOException running import job: java. io.IOException:Hive 以状态 9 退出
当我输入命令时: ./sqoop-import --connect jdbc:mysql://localhost/sqoop2 -table sqeep2 -m 1 -hive-import 当执行这
安卓充气城堡 : IOException
我正在使用 Sun 的 keytool 创建一个 Bouncy caSTLe keystore 并将证书导入其中。 keytool 确实会生成一个 Bouncy caSTLe 格式的 keystore
Java IOException
我正在执行下面的程序，它通过 java 调用 shell，我得到了异常请帮助我。程序: import java.io.*; import java.util.*; public class Proc
android - IOException 无法删除路径
我在我的一个项目中遇到了这个错误。 FAILURE: Build failed with an exception. What went wrong: Execution failed for tas
java - IOException:读取结束死
什么情况下read end可以死对偶PipedOutputStream和 PipedInputStream ?我没有关闭任何管道。最佳答案我遇到了java.io.IOException: Read
java - 在文件读取期间强制 IOException
我有一段从文件中读取数据的代码。我想在此代码中强制 IOException 用于测试目的(我想检查代码在这种情况下是否抛出正确的自定义异常)。例如，有什么方法可以创建一个防止被读取的文件？也许处理一
java - MapReduce IOException
我为MapReduce文本排序编写了这样的代码: public static class SortMapper extends Mapper { private Text citizenshi
java - IOException 未捕获
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
java - IOException - 详细消息所有问号
我要createNewFile有一条路径，但我得到了一个 IOException。问题是，详细的消息无法解释，我只能看到一堆问号。我最初使用的是西类牙语的 Windows 10，但安装了中文语言包。
Java 捕获 IOException
我认为这是基本的东西，但我不知道该怎么做。为什么我得到 IOException never throw in body of相应的 try 语句 public static void main(Str
java - 在加载时要在属性文件中放入哪些值才能获取 IOException？
我正在从 Java 项目中的类路径读取文件。示例代码: public static Properties loadPropertyFile(String fileName) {

首页

博学

6Ren·AI

商城

hadoop - Hive 失败，出现 java.io.IOException(拆分超出最大块位置 .... 拆分大小 : 45 maxsize: 10)