Hadoop 容量调度程序和 Spark-6ren

Hadoop 容量调度程序和 Spark

转载作者：可可西里更新时间：2023-11-01 16:47:05

26

4

如果我按照此处的说明在 yarn 中定义 CapacityScheduler 队列

http://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/CapacityScheduler.html

如何让 spark 使用它？

我想运行 spark 作业...但它们不应占用所有集群，而是在分配了一组固定资源的 CapacityScheduler 上执行。

这可能......特别是在 cloudera 平台上(考虑到 cloudera 上的 Spark 在 yarn 上运行？)。

最佳答案

您应该根据需要通过编辑 capacity-scheduler.xml 配置 CapacityScheduler。您还需要在 yarn-site.xml 中指定 yarn.resourcemanager.scheduler.class 为 org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler 这也是当前 hadoop 版本的默认选项
将 spark 作业提交到设计的队列。

例如:

$ ./bin/spark-submit --class org.apache.spark.examples.SparkPi \
    --master yarn \
    --deploy-mode cluster \
    --driver-memory 4g \
    --executor-memory 2g \
    --executor-cores 1 \
    --queue thequeue \
    lib/spark-examples*.jar \
    10

--queue表示你要提交的队列，需要符合你的CapacityScheduler配置

关于Hadoop 容量调度程序和 Spark，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36167378/

26

4

0

文章推荐： hadoop - 如何使用 Hive 处理倾斜数据？

文章推荐： c# - REST API 设计 - 使用请求主体删除多个项目

文章推荐： api - 如何使用水槽流式传输网站数据

Java 程序和 Windows 任务栏
我刚刚用 java-swing 为我写了一个桌面时钟，我希望每次登录时该时钟都运行。为此，我将我的 jar 文件添加到 start 文件夹，我让时钟开始运行。但我的问题是 - 任务栏中显示的图标允
Java 程序和 YouTube API
我正在尝试编写一个程序来检查用户是否上传了新视频。我想让它成为一项后端工作，不断检查用户最近的视频，然后使用我的应用程序向我的用户发送推送。有关于这个问题的任何文档或示例代码吗？我完全不知道从哪里开始
php - C 程序和 PHP 程序之间的通信
我正在为我的 Raspberry Pi 编写一个程序，该程序由两个主要部分组成: 使用 Spotify-API“Libspotify”搜索音乐并播放音乐的 C 程序。一个在 apache2 We
c++ - C++ 程序和 cmd 控制台之间的管道
我做了一个C++生成命令行并将命令转发给它的程序。目前，我正在将 cmd 控制台的输出发送到一个文件，并在我的 C++ 程序中读取它。但我想让它与管道一起工作。是否可以从 Windows cmd 行
c - 如何使用 C 程序和 malloc 找出处理器的页面大小？
是否可以使用 C 程序和 malloc 找出处理器的页面大小？而不是使用 sysconf() 调用？最佳答案如果你可以#include一些linux内核头文件，你可以在中找到宏PAGE_SIZE
c - 如何从 C 程序和 Ubuntu 操作系统读取远程设备的文件？
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
mysql - C 程序和 Ruby on Rails 应用程序之间传递数据的方式
我想实现一个算法: 从 Ruby on Rails 应用程序获取数据库对象作为输入，对输入执行计算，根据计算查询 Rails 数据库，并根据查询生成一组有序结果。我将用 C(也许是 Objec
python - 执行并等待结果 C 程序和 Python 脚本
我今天的任务是创建一个 Python 脚本(例如 A.py)，它可以执行以下操作: 启动 C 程序(例如 CProg)并传递一些参数启动另一个 Python 脚本(例如 B.py)并传递其他参数加
.net - 在 C++ 程序和 .NET 程序之间进行远程调用的最简单方法
我有一个在后台运行的 .NET 程序，需要创建一个可以与该程序通信的 Windows Shell 扩展。起初我以为我会在 .NET 中创建我的 Shell Extension，并使用 IpcServe
python - 让 python 程序和 c 程序共享数据的最佳方法是什么
Python 程序做前端工作，C 程序做后端工作。它们中的每一个都是一个单独的过程。 Python 进程充当主进程，向 C 进程发送信号和事件。 C 进程生成统计信息、计数器和信息，这些信息被发送回
c - 在 C 程序和 shell 脚本之间共享头文件
如何与 shell 脚本共享 C 头文件？ shell 脚本通过命名管道与 C 程序通信。让我们假设 C 头文件中定义的枚举 SAMPLE_ONE 由 C 程序写入管道。 shell 脚本从管道中读出
windows - Delphi 程序和 Windows 64 位兼容性问题
我有一些客户/候选人提示我的程序不能在他们的 Windows 7 64 位版本上运行(已通过屏幕截图确认)。错误很奇怪，例如: in the trial version i am getting a
c++ - C++ 程序和 SDL 中的 main() 冲突
这个问题在这里已经有了答案: Why SDL defines main macro? (2 个答案) 关闭 7 年前。我在 Windows 操作系统下使用 QT Creator 的简单程序中使用
c - 扩展 C-Shell 程序和 chdir() 无法正常工作
我的导师给了我们一个基本的 C shell 来扩展，我目前正在努力让 shell 在用户在命令行中输入“cd [directory]”时更改目录。我已经得到它来停止段错误，但它不会更改目录。谁能告诉我
无法让 C 程序和 strsep() 和 getenv() 一起工作
我以前有过这个工作，但我使用的是指针。 getenv() 不断崩溃，所以我使用 sprintf() 复制了结果。现在我想用 : 删除并只打印第一次出现的地方。请帮忙! #include #inclu
C11 _Generic c 程序和 Eclipse c/c++ 上的错误
你好，我第一次使用 C primer plus book 学习 C，然后在第 16 章关于 C11 标准的 _Generic 我在 Eclipse c/c++ 中编写了一个程序并构建它产生了 8 个错
python - 使用退出代码在 C 程序和 python 程序之间进行 C 通信
我正在尝试从另一个 C 程序执行 python 程序，其中 py 脚本的返回值为 int array[3] 我可以从 python 退出代码中获取这个数组吗？？编辑:如果问题不清楚，我可以将 pyt
java - 使用 Java 的 ChickenCounter 程序和 ChickenCounter 测试器
// The countChicken() method should count the number of occurrences of the word chicken (or some oth
c# - 如何在 C# 程序和 Node.js 程序之间使用 Msgpack？
我已经通过 ZMQ 使用同一类成功地从 C# 和 C++ 程序传输数据，其中 C++ 类是数据定义，编译器幸运地将字节数组屏蔽到类。我如何在 C# 和 Node.js 程序之间做同样的事情？我认为他
c++ - makefiles 和将 eclipse 用于 Linux 程序和 C++
任何人都可以为我指明有关 makefile 如何工作以及如何使用 eclipse 从头开始基本程序的好教程的方向吗？我正在为 fedora 和 C++ 使用 eclipse 3.4.1 版。提前致

首页

博学

6Ren·AI

商城

Hadoop 容量调度程序和 Spark