apache-spark - Spark - X 毫秒后执行器心跳超时-6ren

apache-spark - Spark - X 毫秒后执行器心跳超时

转载作者：行者123 更新时间：2023-12-04 14:34:19

24

4

我的程序从目录中的文件中读取数据，这些文件的大小为 5 GB。我对这些数据应用了许多功能。我在具有 32 GB RAM 的虚拟机上作为独立(本地)运行 spark。

使用的命令:

bin/spark-submit --class ripeatlasanalysis.AnalyseTraceroute     --master local --driver-memory 30G  SparkExample-lowprints-0.0.5-SNAPSHOT-jar-with-dependencies.jar  1517961600  1518393600 3600

1517961600 1518393600 3600是jar文件的参数。

有时程序运行没有错误，有时没有，并且得到错误:

Exception in thread "main" org.apache.spark.SparkException: Job aborted due 
 to stage failure: Task 0 in stage 2.0 failed 1 times, most recent   failure: Lost task 
0.0 in stage 2.0 (TID 119, localhost, executor driver):  
ExecutorLostFailure (executor driver exited caused by one of the running   tasks) 
Reason: Executor heartbeat timed out after 128839 ms
 Driver stacktrace:
   at org.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGSchedule  r$$failJobAndIndependentStages(DAGScheduler.scala:1887)
   at org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:1875)

问题已问 here没有回应。

最佳答案

我没有找到关于你的程序的太多信息，但一般来说这可能是由于网络问题而发生的，或者卡在计算中，但你可以做两个步骤。首先，将您工作的数据帧重新分区为更多数字，例如 df.repartition(1000)或者您可以在连接的情况下根据连接列重新分区。您还可以增加 maxResultsSize，

第二:可以增加执行器和网络超时。

--conf spark.network.timeout 10000000 --conf spark.executor.heartbeatInterval=10000000   --conf spark.driver.maxResultSize=4g

关于apache-spark - Spark - X 毫秒后执行器心跳超时，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54036028/

24

4

0

文章推荐： css - 水平文本旁边的垂直文本 react 原生？

文章推荐： html - Material 表中的 Angular 6 索引不起作用

文章推荐： html - 如何在图片的右上角放置按钮

文章推荐： python - Ubuntu:找不到 Python 命令，但 apt 说它已经安装

java - 等待()/等待(超时)/ sleep (超时)？
wait() 和 wait(timeout) 之间有什么区别。无论如何 wait() 需要等待通知调用，但为什么我们有 wait(timeout)？那么 sleep(timeout) 和 wait(
超时 XMLHttpRequest
如何向以下脚本添加超时？我希望它将文本显示为“超时”。 var bustcachevar = 1 //bust potential caching of external pages after in
Firebase Once() 超时
我正在使用 Firebase once() 方法来检索 React Native 移动应用中的值。问题是，如果手机离线，once() 永远不会返回。文档说 ref.off() 方法应该取消回调，但这似
Cassandra 超时？
我在一个表中有一个大型数据集(超过 200 万行，每行超过 100 列)，存储在 cassandra 中，几个月前(也许是 2 个月？)我能够执行一个简单的命令来跟踪该表中的记录数量: SELECT
JavaScript 超时
我使用 jquery 开发移动应用程序，下面是我的代码，当我向包含的页面添加 5 或 6 行时，一切正常。但如果我添加多行显示错误消息:Javascript 执行超时。 function succes
Javascript 超时
我正在使用一个 javascript 确认，它将在 15 分钟后重复调用。如果用户未选择确认框中的任何选项我会在等待 1 分钟后重定向他。如何实现这一目标？我的代码是这样的 var timeo
JavaScript 超时
每次我在沙箱环境中运行这段代码时，我都会超时并最终崩溃。我已经通过多个 IDE 运行它，但仍然找不到任何语法错误。如果有人看到了我没有看到的东西，我将非常感谢您的意见。 //assign variab
路由前的 Angular 超时
更新联系人后我会显示一条消息，1500 毫秒后我会转到另一个页面。我是这样做的: onSubmit() { if (this.form.valid) {
某些服务器的 PHPMailer 超时
从昨天开始，我拼命尝试使用最新版本的 PHPMailer 运行一个非常简单的电子邮件脚本。最荒谬的是，同一个脚本在两台服务器上不起作用，但在另一台服务器上却起作用。这是我的尝试(来自 PHPMai
c# - HttpWebRequest 超时
我已阅读以下 2 篇文章并尝试实现相同的文章。我的代码是这样的，超时发生在这里 HttpWebRequest wr = (HttpWebRequest)WebRequest.Create(url);
php - 套接字 - 超时
我正在尝试连接到 wsdl 服务，但收到此错误: wsdl 错误:获取 http://api.didww.com/api/?wsdl - HTTP 错误: header 的套接字读取超时本地没有问
Ansible get_url 超时
我在使用 Ansible 的 CentOs7 实例上从 Artifactory 下载 jar 文件时遇到问题。这是我第一次在 Linux 实例上这样做。我在每个 Windows 实例上都使用了 wi
未强制执行 php7 超时
在过去的两天里，我一直在寻找原因，我在互联网上和堆栈上尝试了很多解决方案。我有一个带有 ubuntu 16.04 和 apache2 的专用 VM -> 服务器版本:Apache/2.4.18 (U
PHP file_get_contents() 超时？
我正处于构建 PHP 应用程序的早期阶段，其中一部分涉及使用 file_get_contents()从远程服务器获取大文件并将它们传输给用户。例如，要获取的目标文件是 200 mB。如果下载到服务器
C# TcpClient 超时
我正在尝试连接到本地网络内的路由器。到目前为止，我已经使用了 TcpClient。检查我的代码: public static void RouterConnect() {
ruby - Mechanize 超时
我正在尝试构建一段代码来搜索使用 Mechanize 和 Ruby 超时的页面。我的测试台包括一个专门写入超时的页面，以及 3 个正常运行的页面。这是代码: urls = ['http://examp
Python : SpaqrlWrapper, 超时？
我是 python 的新手，也是语义网查询领域的新手。我正在使用 SPARQLWrapper 库查询 dbpedia，我搜索了库文档但未能找到从 sparqlWrapper 触发到 dbpedia 的
elixir - “handle_call”超时
我正在从 GenServer 中的句柄信息功能调用 elixir genserver 以添加电话号码获取表单客户端。但是一旦调用了handle_call，所有者进程就会崩溃[超时]。请帮忙。全局创建
WCF 超时 - 线程是否被终止或允许完成
假设我的 WCF 服务中有以下执行链: ServiceMethod 调用并等待 Method1，然后调用并等待 Method2，后者调用并等待 Method3。最后 ServiceMethod 在返回
qt - QNetworkAccessManager 超时
目前我正在开发一个从远程服务器发送和接收文件的应用程序。为了进行网络操作，我正在使用 QNetworkAccessManager。要上传文件，我使用 QNetworkAccessManager::p

首页

博学

6Ren·AI

商城

apache-spark - Spark - X 毫秒后执行器心跳超时