apache-spark - 为什么 Spark 作业失败并出现 org.apache.spark.shuffle.MetadataFetchFailedException : Missing an output location for shuffle 0 in speculation mode?-6ren

apache-spark - 为什么 Spark 作业失败并出现 org.apache.spark.shuffle.MetadataFetchFailedException : Missing an output location for shuffle 0 in speculation mode?

转载作者：行者123 更新时间：2023-12-03 05:22:06

28

4

我正在以推测模式运行 Spark 作业。我有大约 500 个任务和大约 500 个 1 GB gz 压缩文件。我不断地进入每项作业，对于 1-2 个任务，附加错误，然后它会重新运行数十次(阻止作业完成)。

org.apache.spark.shuffle.MetadataFetchFailedException: Missing an output location for shuffle 0

知道这个问题的含义是什么以及如何克服它吗？

org.apache.spark.shuffle.MetadataFetchFailedException: Missing an output location for shuffle 0
    at org.apache.spark.MapOutputTracker$$anonfun$org$apache$spark$MapOutputTracker$$convertMapStatuses$1.apply(MapOutputTracker.scala:384)
    at org.apache.spark.MapOutputTracker$$anonfun$org$apache$spark$MapOutputTracker$$convertMapStatuses$1.apply(MapOutputTracker.scala:381)
    at scala.collection.TraversableLike$$anonfun$map$1.apply(TraversableLike.scala:244)
    at scala.collection.TraversableLike$$anonfun$map$1.apply(TraversableLike.scala:244)
    at scala.collection.IndexedSeqOptimized$class.foreach(IndexedSeqOptimized.scala:33)
    at scala.collection.mutable.ArrayOps$ofRef.foreach(ArrayOps.scala:108)
    at scala.collection.TraversableLike$class.map(TraversableLike.scala:244)
    at scala.collection.mutable.ArrayOps$ofRef.map(ArrayOps.scala:108)
    at org.apache.spark.MapOutputTracker$.org$apache$spark$MapOutputTracker$$convertMapStatuses(MapOutputTracker.scala:380)
    at org.apache.spark.MapOutputTracker.getServerStatuses(MapOutputTracker.scala:176)
    at org.apache.spark.shuffle.hash.BlockStoreShuffleFetcher$.fetch(BlockStoreShuffleFetcher.scala:42)
    at org.apache.spark.shuffle.hash.HashShuffleReader.read(HashShuffleReader.scala:40)
    at org.apache.spark.rdd.ShuffledRDD.compute(ShuffledRDD.scala:92)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:263)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:230)
    at org.apache.spark.rdd.MappedRDD.compute(MappedRDD.scala:31)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:263)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:230)
    at org.apache.spark.rdd.FlatMappedRDD.compute(FlatMappedRDD.scala:33)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:263)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:230)
    at org.apache.spark.rdd.MappedRDD.compute(MappedRDD.scala:31)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:263)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:230)
    at org.apache.spark.rdd.MappedRDD.compute(MappedRDD.scala:31)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:263)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:230)
    at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:61)
    at org.apache.spark.scheduler.Task.run(Task.scala:56)
    at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:196)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
    at java.lang.Thread.run(Thread.java:722)

最佳答案

当我为工作节点提供的内存比它拥有的内存多时，就发生了这种情况。由于它没有交换空间，spark 在尝试存储对象进行混洗时崩溃了，而内存已耗尽。

解决方案是添加交换，或者配置工作程序/执行程序以使用更少的内存，此外还对多个持久性使用 MEMORY_AND_DISK 存储级别。

关于apache-spark - 为什么 Spark 作业失败并出现 org.apache.spark.shuffle.MetadataFetchFailedException : Missing an output location for shuffle 0 in speculation mode?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28901123/

28

4

0

文章推荐： iphone - 不规则地获取sqlite3_prepare_v2中的Exc_Bad_Access

文章推荐： asp.net-mvc - 网页:Version setting do?是什么意思

文章推荐： asp.net - 如何传递日期时间参数？

文章推荐： visual-studio-2013 - Visual Studio 2013/2015 空闲 CPU 使用率

Python正则表达式查找目录路径(\\\\Location\\Location\\Location)
我正在尝试在 python 中编写正则表达式来查找目录路径:我的文本如下所示: text = "The public disk is: \\\\diskA\\FolderB\\SubFolderC\\
android - Location#distanceTo(Location) 是否考虑了 Location#getAccuracy()？
我想写一个LocationListener，它把最近最精确的位置作为它的位置。我打算在我的 LocationListener 中使用此代码: @Override public void
r - 我可以取回诸如 : "hover location", "Brush location"或 "click location"之类的信息吗
我想建立一个有光泽和 plotly 的交互式图表。 Shiny 有一个内置功能来获取有关用户交互的信息。比如:input$plot_click、input$plot_dblclick、input$pl
javascript - 错误尝试调用虚拟方法'android.location.Location
我正在使用 MobileFirst 提供的 WL.Device.Geo.acquirePosition(onGeoLocationSuccess, onGeoLocationFailure, opti
angularjs - $state.go(app.location) 和 $location.path ("app/location"有什么区别？
我最近开始使用 ionic 框架，它里面有 angular js。为了在屏幕之间导航，我使用了 $location.path 并且效果很好。但是，在我下载的一个示例中，我看到 $state.go 被用
javascript - 历史推送状态不在独立的 location.hash 或 location.href 中，而是在 Location 对象本身中
谁能解释一下这种行为？我使用 history.pushState(null, null, '#test'); 推送历史状态。然后，当尝试使用console.log(window.location.ha
javascript - 为什么 href 中的 $location.absUrl(), $location.$$url, $location.$$path 为空？
这里是相关代码: https://www.facebook.com/sharer/sharer.php?u={{$location.absUrl()}} https://www.facebook.c
android - 文档.location.href ='#location' ;对比 $.mobile.changePage ('#location')；
这两个重定向之间有什么区别？我有一个应用程序，当我使用时，它可以在 chrome 和 android 4 上正常工作，但在 android 2.x.x 上不能正常工作 document.locatio
javascript - window.location.href=window.location.href 和 window.location.reload() 之间的区别
JavaScript 的区别是什么 window.location.href = window.location.href 和 window.location.reload() 功能？最佳答案如果
javascript - window.location.href、window.location.replace 和 window.location.assign 之间的区别
有什么区别 window.location.href="http://example.com"; window.location.replace("http://example.com"); wind
javascript - window.location.href=window.location.href 和 window.location.reload() 的区别
JavaScript 的区别是什么 window.location.href = window.location.href 和 window.location.reload() 功能？最佳答案如果
php - Nginx "location ~ ."与 "location ~*\."
以下 3 个指令之间有区别吗？ location ~* \.(png)$ { expires max; log_not_found off; } location ~ \.(png)$ {
javascript - 使用 document.location.href 或 window.location 或 window.location.href 在 Chrome 的 beforeunload 期间未重定向到指定的 URL
位于正文末尾之前的以下脚本在 Internet Explorer 和 Chrome(以及任何其他浏览器)中都会被调用。但重定向到指定的 URL 仅发生在 IE 中。我还尝试了 window.locat
javascript - 如何同时设置$location.path和$location.search？
我正在使用 Angular ngRouter。我需要更改 url 路径以及搜索参数。我知道 $location.path 和 $location.search，但是有没有一个函数可以同时设置它们？最
javascript - $location 和 window.location 比较
在angularjs中用$location和window.location哪个更好。例如，我们可以使用$location.path() 或window.location.href 来完成同样的工作。
javascript - document.location/parent.location - 可以阻止它们吗？
我在我的网站上使用上述 2 个命令。似乎它们对 95% 访问它应该触发的页面的人有效，但对其他人则不会。有谁知道是否可以完全阻止这些 javascript 命令？我真的很头疼为什么它们有时不起作用。
android - ClassCastException 类扩展了 android.location.Location
这是我无法弄清楚的另一个错误。我有这个类ExtendedLocation extends Location实例化时抛出 ClassCastExceptioncurrentGpsLocation =
android - 类 android.location.Location 没有定义无参构造函数
我一直在尝试简单地将一个包含两个变量(一个字符串和一个位置)的类推送和读取到 firebase，但我一直收到此错误。 **com.google.firebase.database.DatabaseEx
iOS Location Services 访问和系统 Frequent Location
我注意到 iPhone 上的“常用位置”似乎比监控 iOS 访问的应用程序 (https://developer.apple.com/reference/corelocation/clvisit) 使
javascript - location.href = location.href 不会重定向
在我的 javascript 代码中，在某些时候，我需要刷新窗口(用户上传了新图片但在页面中仍然可以看到它) 我想知道为什么 location.href = location.href 不刷新窗口？

首页

博学

6Ren·AI

商城

apache-spark - 为什么 Spark 作业失败并出现 org.apache.spark.shuffle.MetadataFetchFailedException : Missing an output location for shuffle 0 in speculation mode?