hadoop - Hadoop作业引发java.io.IOException:尝试从封闭流中读取-6ren

hadoop - Hadoop作业引发java.io.IOException:尝试从封闭流中读取

转载作者：行者123 更新时间：2023-12-02 21:55:50

25

4

我正在运行一个简单的map-reduce工作。此作业使用来自常见爬网数据的250个文件。

例如s3:// aws-publicdatasets / common-crawl / parse-output / segment / 1341690169105 /

如果使用50、100个文件，一切正常。但是用250个文件我得到这个错误

java.io.IOException: Attempted read from closed stream.
    at org.apache.commons.httpclient.ContentLengthInputStream.read(ContentLengthInputStream.java:159)
    at java.io.FilterInputStream.read(FilterInputStream.java:116)
    at org.apache.commons.httpclient.AutoCloseInputStream.read(AutoCloseInputStream.java:107)
    at org.jets3t.service.io.InterruptableInputStream.read(InterruptableInputStream.java:76)
    at org.jets3t.service.impl.rest.httpclient.HttpMethodReleaseInputStream.read(HttpMethodReleaseInputStream.java:136)
    at org.apache.hadoop.fs.s3native.NativeS3FileSystem$NativeS3FsInputStream.read(NativeS3FileSystem.java:111)
    at java.io.BufferedInputStream.fill(BufferedInputStream.java:218)
    at java.io.BufferedInputStream.read(BufferedInputStream.java:237)
    at java.io.DataInputStream.readByte(DataInputStream.java:248)
    at org.apache.hadoop.io.WritableUtils.readVLong(WritableUtils.java:299)
    at org.apache.hadoop.io.WritableUtils.readVInt(WritableUtils.java:320)
    at org.apache.hadoop.io.SequenceFile$Reader.readBuffer(SequenceFile.java:1707)
    at org.apache.hadoop.io.SequenceFile$Reader.seekToCurrentValue(SequenceFile.java:1773)
    at org.apache.hadoop.io.SequenceFile$Reader.getCurrentValue(SequenceFile.java:1849)
    at org.apache.hadoop.mapreduce.lib.input.SequenceFileRecordReader.nextKeyValue(SequenceFileRecordReader.java:74)
    at org.apache.hadoop.mapred.MapTask$NewTrackingRecordReader.nextKeyValue(MapTask.java:532)
    at org.apache.hadoop.mapreduce.MapContext.nextKeyValue(MapContext.java:67)
    at org.apache.hadoop.mapreduce.lib.map.MultithreadedMapper$SubMapRecordReader.nextKeyValue(MultithreadedMapper.java:180)
    at org.apache.hadoop.mapreduce.MapContext.nextKeyValue(MapContext.java:67)
    at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:143)
    at org.apache.hadoop.mapreduce.lib.map.MultithreadedMapper$MapRunner.run(MultithreadedMapper.java:268)

有什么线索吗？

最佳答案

您必须处理多少个 map 位？接近100吗？

这是一个猜测，但是在处理第一批文件时，与S3的连接可能超时，并且随着插槽可用于处理其他文件，该连接不再打开。我相信来自NativeS3FileSystem的超时错误会显示为IOExceptions。

关于hadoop - Hadoop作业引发java.io.IOException:尝试从封闭流中读取，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14203621/

25

4

0

文章推荐： hadoop - 我们可以在Hadoop中将图像转换为Avro格式吗？

文章推荐： javascript - 将 php 变量复制到 JavaScript 变量导致设计问题

文章推荐： javascript - 如何在 Github Pages 中加载本地 JavaScript 库？

文章推荐： hadoop - 使用HBase-0.94.2配置hadoop-2.0.2-alpha

groovy - 封闭
从the documentation, 13.5.5: When the last parameter of a method is a closure, you can place the clos
c++ - “封闭”友元类的范围
Bjarne Stroustrup 写道: “友元类必须事先在封闭范围内声明或在非类范围内定义，立即封闭声明它为友元的类” 语句的第一部分不是多余的，因为“立即包含类的非类范围”包括“先前在封闭范围中
arrays - 确定网格上的点是否为 "trapped"(封闭)
我有一个网格(如下例)，其中包含外墙(标记为 W)、环境 block (E)、开放空间 (o) 和事件点 (A)。目前，此网格存储在 [,] 中，其中包含与给定点关联的所有数据。我试图确定是否包含一个
haskell - 量化约束与(封闭)类型族
我正在尝试使用 this blogpost's approach to higher-kinded data without dangling Identity functors for the tr
go - 封闭 channel 发送值为零吗？
在下面的代码中: package main import ( "fmt" "time" ) func asChan(vs ...int) <-chan int { c := m
lambda - 传递和评估防 rust 封闭
我在传递和评估闭包列表时遇到困难。经过大量简化，该程序显示出与我正在尝试编写的程序相同的错误: use std::vec::flat_map; #[main] fn main() { let li
Javascript:如何清除非全局(封闭)setTimeout？
我正在努力成为一名好公民，并尽可能远离全局范围。有没有办法访问不在全局范围内的 setTimeout 变量？因此，在此示例中，某人将如何取消“计时器”？ myObject.timedAction =
python - 是否可以修改python中位于外部(封闭)但不是全局范围内的变量？
考虑这个例子: def A(): b = 1 def B(): # I can access 'b' from here. print(b)
intellij-idea - 封闭 lambda 的隐式参数被遮蔽
val listPlans: List = newPlans.mapTry { it.data.map { Plan(it.id, it.nam
angularjs - Angular 单元测试-同一服务中的模拟方法/封闭
我目前正在尝试使用SinonJS对我的 angular.service 进行单元测试，但是遇到了一个问题，希望有人可以阐明为什么会发生这种情况。我已经重构了当前的项目以说明当前的问题。我还提供了DE
go - 封闭 channel 与零 channel
我正在使用 Go channel ，我想知道关闭 channel 和将其设置为 nil 之间有什么区别？编辑: 在此example ，我想通过关闭 channel 或设置为零来断开发送者和接收者的连
objective-c - NSTextView 封闭 ScrollView 在空格键上跳转
我的应用程序有一个奇怪的行为，我不知道它来自哪里。我已经为 TextView 内容实现了 NSScanner，效果非常好。扫描器与文本存储结合使用，通过 TextView 委托(delegate)方法
java - Mybatis，封闭 OR 与 SQL 构建器
我不知道如何让 MyBatis 生成封闭的 or 语句: WHERE x.token = ? AND ( (x.scene = 'A' OR x.scene = 'B')) 这是一个令人惊讶的简单
android - 检测定义区域(封闭)之间屏幕(而非相机)上的颜色
我不希望这是一个摄像头检测程序。这是一个程序，可以检测应用程序屏幕上颜色的传递。我想要做的是检测大于 5x5 像素的黑色何时穿过屏幕上定义的空间区域。我想过用一个大区域来拉伸(stretch)整个宽
python - 使用 RDFLib 时处理缺少 <> 封闭 URL
我一直在使用 RDFLib 来解析数据并将其插入到三元组中。我遇到的一个常见问题是，从关联数据存储库解析时，没有尖括号括起 URL。要上传数据，我必须手动添加并使用 URIRef重新创建 URL。
generics - 开放、封闭、绑定(bind)和非绑定(bind)通用类型
我已经阅读了很多有关此问题的帖子，但我仍然不确定我是否完全理解这些定义。以下是我认为不同术语的示例。我是否走在正确的轨道上，或者我仍然不理解这些概念。谢谢 Array - unbound and o
android - Google Play - 封闭/内部测试 : How to remove/disable App on Tester's Device?
我为我的 Android 应用设置了 GooglePlay 内部和封闭式 Alpha 测试设置。它非常适合允许测试人员加入计划并安装应用程序，但是当我从测试人员电子邮件列表中删除测试人员时，他们仍然

首页

博学

6Ren·AI

商城

hadoop - Hadoop作业引发java.io.IOException:尝试从封闭流中读取