apache-spark - 在 YARN 上启动 Spark 应用程序之前，如何等到所有执行程序都分配完毕？-6ren

apache-spark - 在 YARN 上启动 Spark 应用程序之前，如何等到所有执行程序都分配完毕？

转载作者：行者123 更新时间：2023-12-03 15:45:55

28

4

我们在 yarn 集群上运行 Spark 作业，发现即使没有足够的资源， Spark 作业也会启动。

举一个极端的例子，一个 spark 作业需要 1000 个执行器(4 个内核和 20GB 内存)。而在整个集群中，我们只有 r3.xlarge 的 30 个节点。 (4 核和 32GB 内存)。该作业实际上只需 30 个执行程序即可启动和运行。
我们尝试将动态分配设置为 false，并尝试了容量调度程序和 yarn 公平调度程序。一样的。

任何想法如何在没有足够资源的情况下使工作无法开始？是否有任何 Spark 侧或 yarn 侧设置？

最佳答案

我好像刚刚回复了a very similar question .

考虑一个用例，您不想等待所有可用资源，并在数量刚好足以启动任务时立即启动。
这就是 YARN 上的 Spark 有一个额外检查(又名 minRegisteredRatio)的原因，它是在应用程序开始执行任务之前请求的最少 80% 的内核。
由于您希望在 Spark 应用程序启动之前让所有内核都可用，请使用 spark.scheduler.minRegisteredResourcesRatio Spark 属性来控制比例。
报价the official Spark documentation (突出显示我的):

spark.scheduler.minRegisteredResourcesRatio

0.8 for YARN mode

The minimum ratio of registered resources (registered resources / total expected resources) (resources are executors in yarn mode, CPU cores in standalone mode and Mesos coarsed-grained mode ['spark.cores.max' value is total expected resources for Mesos coarse-grained mode] ) to wait for before scheduling begins. Specified as a double between 0.0 and 1.0. Regardless of whether the minimum ratio of resources has been reached, the maximum amount of time it will wait before scheduling begins is controlled by config spark.scheduler.maxRegisteredResourcesWaitingTime.

关于apache-spark - 在 YARN 上启动 Spark 应用程序之前，如何等到所有执行程序都分配完毕？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47926261/

28

4

0

文章推荐： clang - 建筑 clang 永远

文章推荐： css - 有什么方法可以获得特定于断点的宽度类？

文章推荐： python - Pandas，如何将多列组合成一个数组列

haskell 执行程序。文件和cmd
我是 Haskell 世界的新手，我编译了一个简单的 exe.program main = do putStrLn "Hello, what's your name?" name
java - JUnit @before 执行程序
我正在使用 JUnit，现在我想在运行测试之前执行 Java 程序(主方法)。即在我的项目中，我有一个包含一个具有 main 方法的类的包。我想在运行测试之前运行它(可能在一个单独的进程中)，因为被
无法使用 execv() 执行程序
我的代码是: char* arg_list[] = { "gnuplot", "gnuplot_script.sh", NULL }; printf("Ready %s %s\n", arg_list
启用 PHP 执行程序？
exec() 似乎在服务器上启用(function_exists('exec') 返回 true，并且命令未在 'disable_functions' 变量中列出)但我们得到警告:出于安全原因，ex
flash - Adobe AIR 执行程序
我想从 Adobe AIR 应用程序中按下一个按钮并执行一些已安装的程序。例如，我会有一个名为“Start Winamp”的按钮。当按下它时，它应该直接启动 Winamp.exe...我不想执行一
makefile - 制作、安装、执行程序
我学习 CS 有一段时间了，似乎我(或我的许多 friend )从来不了解在制作、安装等方面幕后发生的事情。纠正我，但是 make 是一种编译一组文件的方法吗？在 Windows 上“将程序安装到
c# - 从 MemoryStream 执行程序
如何执行 MemoryStream 中的程序，这样我就不必先将它保存到硬盘上。该文件可能不会临时保存到硬盘。该程序必须在内存中 100% 正常运行。 static string s
python - 如何停止使用 python 执行程序？
我使用了一个程序(在 Windows 上)，我不会透露其名称，它可以从命令行打开而无需通过任何身份验证。我正在尝试创建一些安全措施以防止其他人以这种方式访问它。我计划用批处理文件替换这个程序的内
php - 执行程序 php linux
我正在开发一个 Web 应用程序，但我陷入了困境: 我想创建一个简单的标签来触发本地程序的执行如gedit、mozilla firefox等我的项目基于 HTML、Javascript 和 PHP。
c++ - 在运行时使用 root 执行程序
我有一个 C++ 程序需要 root 权限才能执行某些功能。如果我在 su 模式下运行编译后的代码，例如 linux-c5b6:/home/suman # 它满足了我的要求，但是在运行时我想检查我的进
c - 允许使用 execvp 执行程序
我正在创建一个 shell 副本，但在执行自制程序时遇到了问题。我的意思是，当我想执行诸如 java、ls、wc 等之类的东西时，一切都很好......已经存在于路径变量。现在我希望能够执行“myl
c - 从 C 执行程序
我试图让一些值显示在电子墨水显示器上(通过 SPI)。我已经编写了软件来初始化显示并显示作为命令行参数传递的值。问题是，由于电子墨水技术，显示需要几秒钟才能完全实现，所以此时显示程序也在运行。另一个
database - 执行程序 Oracle 11g
所以我在 Oracle 11g 上创建了以下过程: create or replace PROCEDURE calc_fee (proc_borrowed_date IN Borrowing.borr
maven-2 - 如何使用 Maven 执行程序？
我想让 Maven 目标触发 java 类的执行。我正在尝试使用以下行迁移 Makefile: neotest: mvn exec:java -Dexec.mainClass="org.dha
python - 如何从 python 执行程序？操作系统失败
我想用 os.system 运行命令，但出现错误 c:/fe ' is not recognized as an internal or external command, operable prog
apache-spark - 什么是以及如何在Web UI的“执行程序”选项卡中控制内存存储？
我将Spark 1.5.2用于Spark Streaming应用程序。 Web UI的“执行者”选项卡中的存储内存是什么？如何达到530 MB？如何更改该值？最佳答案小心:您使用的非常，非常老旧且
gitlab - 在初始配置后更改 GitLab CI Multirunner 执行程序
我正在阅读 GitLab CI Multirunner documentation它介绍了如何设置 GitLab CI Multirunner 执行器，但我似乎无法在文档或在线搜索中找到有关更改初始设
c - 使用 fork 和 exec 执行程序
我是 C 编程新手。我正在尝试使用 fork()、exec() 和 waitpid() 运行由用户指定的路径给出的程序命令。我已经尝试让它正确运行几个小时了，但我不断收到错误，我不知道如何排除故障，一
javascript - 为什么我们需要将 Firefox 驱动程序强制转换为 javascript 执行程序？
我是 Java 和 Selenium 的初学者，我在工作时遇到了 JavascriptExecutor。想知道:虽然 Remote webdriver 和 Firefox driver 实现了 ja
c++ - 来自 C++ 的 Linux 执行程序
我正在尝试通过 linux c++ 中的邮件命令发送电子邮件，但 execl 导致错误。如何使用 exec 发送此命令？ /bin/echo llol | /usr/bin/mail -s "tes

首页

博学

6Ren·AI

商城

apache-spark - 在 YARN 上启动 Spark 应用程序之前，如何等到所有执行程序都分配完毕？