hadoop - hadoop FIFO调度是否不能使提交的作业并行运行？-6ren

hadoop - hadoop FIFO调度是否不能使提交的作业并行运行？

转载作者：行者123 更新时间：2023-12-02 21:57:30

26

4

根据对FIFO模式和链接的理解，我已配置了4000张 map 的 map 容量，并为每个作业配置了500张 map
Running jobs parallely in hadoop
如果我提交了8个工作，那么这8个工作应该并行运行，对吗？但是，我仍然看到我提交的8个作业是按顺序运行的，这让我感到很奇怪。
另一种方法是尝试公平的调度程序，但是我还有其他一些运行中的错误...
如何使它并行运行？

我现在是唯一的用户。

问题:作业跟踪器Web UI对正在运行的总作业显示什么？

实际上我已经提交了80份工作，因此所有工作都已成功提交，因为我可以看到其中的80份
在“正在运行的作业”部分下，但它们只是按顺序运行

问题:您当前正在处理多少个输入文件？这与该工作的映射器数量有什么关系？

由于我为每个作业都通过mapred-site.xml设置map.task.num = 500配置了500张 map 。

以下是信息

尚待完成运行的已终止的失败/终止的任务尝试的已完成任务总数的百分比

map 1.40％500402402 7 0 0/0

减少0.00％1 1 0 0 0 0/0

问题:您可以将输入格式配置为仅运行500个映射，但是在某些情况下Hadoop会忽略此值:例如，如果您有500个以上的输入文件。

我确定这不会发生，因为我自定义了输入格式，因此要运行的映射器的数量恰好是我在mapred-site.xml中配置的映射器的数量。

问题:开始工作时，正在运行多少个文件，正在使用的输入格式是什么，以及是否对输入文件使用了文件压缩功能？

好的，我实际上只运行一个文件，但是此文件将完全加载到所有maptasks中，因此我实际上使用distrbutecache机制让每个maptask完全加载该文件。我目前没有使用压缩

问题:作业跟踪器对已配置的映射器和 reducer 插槽总数显示什么？这与您的预期值5000相符吗？

以下是信息

map 可减少TotalSubmissions节点 map task 容量可 reduce task 容量平均。任务/节点列入黑名单的节点

83 0 80 8 4000 80 510.00 0

最佳答案

无论您运行FairScheduler还是CapacityScheduler，您仍然应该能够并行运行作业，但是出于某些原因，您可能会看到作业按顺序运行:

您是集群的唯一使用者吗？如果没有，那么还有多少人在使用集群:

问题:作业跟踪器Web UI对正在运行的总作业显示什么？

如果确实是在特定时间在集群上运行的唯一作业，则检查Job Tracker Web UI中当前正在运行的作业-您当前正在处理多少个输入文件？这与该工作的映射器数量有什么关系？

您可以将输入格式配置为仅运行500个 map ，但是在某些情况下Hadoop会忽略此值:例如，如果您有500个以上的输入文件。

问题:开始工作时，正在运行多少个文件，正在使用的输入格式是什么，以及是否对输入文件

使用了文件压缩功能？

问题:作业跟踪器对已配置的映射器和化简器插槽总数显示什么？这与您的预期值5000相符吗？

关于hadoop - hadoop FIFO调度是否不能使提交的作业并行运行？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10294798/

26

4

0

文章推荐： hadoop - hadoop中的文件拆分/分区

文章推荐： hadoop - 多种自定义可写格式

multithreading - Perl中的线程同步/调度
我有一个带有一些功能的perl对象。每个功能从主程序中调用一次。我想并行运行某些功能以节省时间。由于某些功能取决于先前功能的结果，因此我无法将它们全部一起运行。我想到了这样的事情: 对于每个函数，保
python 调度 - 如何避免无限循环？
首先，我的代码在这里: import schedule # see https://github.com/dbader/schedule import crawler def job(): p
java - quartz 调度
从 11 月 1 日开始，我必须使用quartz调度程序每4个月安排一次任务。我使用 cronExpression 来实现同样的目的。但 cronExpression 每年都会重置。所以我的任务将在
java - Akka 调度
我有以下代码块，它调用两个请求，但略有延迟。 final ActorRef actor1 = getContext().actorOf( ActorClass.prop
linux - 调度 - 每个进程使用一个或多个内核堆栈进行上下文切换
考虑到 Linux 的情况，我们为每个用户堆栈都有一个内核堆栈，据我所知，每当发生上下文切换时，我们都会切换到当前进程的内核模式。这里我们保存当前进程的当前状态，寄存器，程序数据等，然后调度器(不确
c - OpenBSD下的pthread优先级/调度
我有将东西移植到 OpenBSD 的奇怪爱好。我知道它有 pthreads 问题，但在 2013 年 5 月发布版本之前我不会升级。我使用的是 5.0，我对 pthreads 还很陌生。我已经学习了
algorithm - 调度:隐式期限率单调算法的提前期限
给定一组任务: T1(20,100) T2(30,250) T3(100,400) (execution time, deadline=peroid) 现在我想将截止日期限制为 Di = f * Pi
python - 调度:最小化非重叠时间范围之间的差距
使用 Django 开发一个小型日程安排 Web 应用程序，在该应用程序中，人们被分配特定的时间与他们的上级会面。员工存储为模型，与表示时间范围和他们有空的星期几的模型具有 OneToMany 关系。
algorithm - 贪心算法，调度
我想了解贪婪算法调度问题的工作原理。所以我一直在阅读和谷歌搜索一段时间，因为我无法理解贪心算法调度问题。我们有 n 个作业要安排在单个资源上。作业 (i) 有一个请求的开始时间 s(i) 和结束时
algorithm - 调度，贪心算法
这是流行的 El Goog 问题的变体。考虑以下调度问题:有 n 个作业，i = 1..n。有 1 台 super 计算机和无限的 PC。每个作业都需要先经过 super 计算机的预处理，然后再在P
python - 调度 Scrapy 蜘蛛以脚本的间隔运行
假设我有一个需要运行多次的蜘蛛 class My_spider(Scrapy.spider): #spider def 我想做这样的事 while True: runner = Cra
kubernetes - 如何调试 kubernetes 调度？
我已将 podAntiAffinity 添加到我的 DeploymentConfig 模板中。但是，pod 被安排在我预计会被规则排除的节点上。我如何查看 kubernetes 调度程序的日志以了
reactjs - 调度 Redux 操作是否被认为是昂贵的？
我已经使用 React - Redux - Typescript 堆栈有一段时间了，到目前为止我很喜欢它。但是，由于我对 Redux 很陌生，所以我一直在想这个特定的话题。调度 Redux 操作(和
azure - 调度 Azure 实例
我想按照预定的计划(例如，周一至周五，美国东部时间晚上 9 点至 5 点)运行单个 Azure 实例以减少账单，并且想知道最好的方法是什么。问题的两个部分: 能否使用服务管理 API [1] 按预定
Drupal 的引导/调度/路由流程
假设最小模块安装(为了简单起见)，Drupal 的 index.php 中两个顶级功能的核心“职责”是什么？ ? drupal_bootstrap(DRUPAL_BOOTSTRAP_FULL); me
scheme - Racket URL 调度
我正在尝试使用 Racket(以前称为 PLT Scheme)连接 URL 调度。我查看了教程和服务器文档。我不知道如何将请求路由到相同的 servlet。具体例子: #lang 方案 (需要网络服
月末的 Airflow DAG 调度
我想在 Airflow (v1.9.0) 上运行计划。我的DAG需要在每个月底运行，但我不知道如何编写设置。 my_dag = DAG(dag_id=DAG_ID, cat
azure - 调度 httpTrigger 函数
我正在尝试在“httpTrigger”类型函数的 function.json 中设置计划字段，但计时器功能似乎未运行。我的目标是拥有一个甚至可以在需要时进行调度和手动启动的功能，而不必仅为了调度而添加
Airflow 无法识别 DAG 调度
我正在尝试制定每周、每月的 Airflow 计划，但不起作用。有人可以报告可能发生的情况吗？如果我每周、每月进行安排，它就会保持静止，就好像它被关闭一样。没有错误信息，只是不执行。我发送了一个代码示例
javascript - firebase 有办法每两周调用一次我的代码吗？调度
我希望每两周自动更新一次我的表格。我希望我的函数能够被 firebase 调用。这可能吗？我正在使用 Angular 2 Typescript 和 Firebase。最佳答案仅通过fireba

首页

博学

6Ren·AI

商城

hadoop - hadoop FIFO调度是否不能使提交的作业并行运行？