- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我一直在 Hadoop 集群版本 0.20.2 上运行作业,直到最近一切都正常,没有任何原因,也没有任何错误, map task 的最后几个百分比比作业的其余部分花费的时间长得多,其中最后 2% 需要 30 秒,其余工作不到 30 秒。
无论输入大小如何,现在所有作业都会发生这种情况
这是一个输入数据为 4GB 的示例,在此问题之前整个作业从提交到完成需要 37 秒,但现在需要一分钟多:
14/08/01 20:57:12 INFO input.FileInputFormat: Total input paths to process : 1
14/08/01 20:57:12 INFO mapred.JobClient: Running job: job_201407301409_0033
14/08/01 20:57:13 INFO mapred.JobClient: map 0% reduce 0%
14/08/01 20:57:33 INFO mapred.JobClient: map 1% reduce 0%
14/08/01 20:57:34 INFO mapred.JobClient: map 7% reduce 0%
14/08/01 20:57:35 INFO mapred.JobClient: map 13% reduce 0%
14/08/01 20:57:36 INFO mapred.JobClient: map 21% reduce 0%
14/08/01 20:57:37 INFO mapred.JobClient: map 33% reduce 0%
14/08/01 20:57:38 INFO mapred.JobClient: map 39% reduce 0%
14/08/01 20:57:39 INFO mapred.JobClient: map 45% reduce 0%
14/08/01 20:57:40 INFO mapred.JobClient: map 54% reduce 0%
14/08/01 20:57:41 INFO mapred.JobClient: map 60% reduce 0%
14/08/01 20:57:42 INFO mapred.JobClient: map 65% reduce 0%
14/08/01 20:57:43 INFO mapred.JobClient: map 72% reduce 0%
14/08/01 20:57:44 INFO mapred.JobClient: map 77% reduce 0%
14/08/01 20:57:45 INFO mapred.JobClient: map 79% reduce 0%
14/08/01 20:57:46 INFO mapred.JobClient: map 86% reduce 0%
14/08/01 20:57:47 INFO mapred.JobClient: map 87% reduce 0%
14/08/01 20:57:48 INFO mapred.JobClient: map 88% reduce 0%
14/08/01 20:57:49 INFO mapred.JobClient: map 90% reduce 0%
14/08/01 20:57:51 INFO mapred.JobClient: map 92% reduce 0%
14/08/01 20:57:52 INFO mapred.JobClient: map 93% reduce 0%
14/08/01 20:57:53 INFO mapred.JobClient: map 94% reduce 0%
14/08/01 20:57:54 INFO mapred.JobClient: map 95% reduce 0%
14/08/01 20:57:55 INFO mapred.JobClient: map 96% reduce 0%
14/08/01 20:57:57 INFO mapred.JobClient: map 98% reduce 0%
14/08/01 20:58:16 INFO mapred.JobClient: map 99% reduce 0%
14/08/01 20:58:28 INFO mapred.JobClient: map 100% reduce 0%
14/08/01 20:58:30 INFO mapred.JobClient: Job complete: job_201407301409_0033
14/08/01 20:58:30 INFO mapred.JobClient: Counters: 8
14/08/01 20:58:30 INFO mapred.JobClient: Job Counters
14/08/01 20:58:30 INFO mapred.JobClient: Rack-local map tasks=19
14/08/01 20:58:30 INFO mapred.JobClient: Launched map tasks=61
14/08/01 20:58:30 INFO mapred.JobClient: Data-local map tasks=42
14/08/01 20:58:30 INFO mapred.JobClient: FileSystemCounters
14/08/01 20:58:30 INFO mapred.JobClient: HDFS_BYTES_READ=4002108148
14/08/01 20:58:30 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=40063116
14/08/01 20:58:30 INFO mapred.JobClient: Map-Reduce Framework
14/08/01 20:58:30 INFO mapred.JobClient: Map input records=2200000
14/08/01 20:58:30 INFO mapred.JobClient: Spilled Records=0
14/08/01 20:58:30 INFO mapred.JobClient: Map output records=2200000
我想知道是否有人知道或可以解释何时或为何会发生这种情况。
顺便说一句,我已将 reducer 的数量设置为 0,因为我不需要它们来完成这项工作,所以我的工作会在所有 map task 完成后完成。
最佳答案
这是在运行 hadoop 作业时通常会注意到的事情。当 map 任务接近完成时,所有 map 任务的结果将合并在一起,这涉及结果的组合和排序。
当 Mapper 仍在运行时,组合和排序并行开始,并在所有 map task 完成时完成。有些 map 提前完成,有些需要更长的时间,取决于机器的资源,导致延迟。我建议你阅读我在搜索更技术性的解释时遇到了本文的“映射过程中发生的情况”部分 link
希望对您有所帮助。
关于java - Hadoop Job 在最后几个百分比时真的很慢吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25087895/
我正在尝试在两个表之间进行空间连接: 表 1:397265 个特征(在 geom 字段上有 gist 索引) 表 2:73 个特征(在 geom 字段上有 gist 索引) 表 1 和表 2 具有相同
我正在尝试在两个表之间进行空间连接: 表 1:397265 个特征(在 geom 字段上有 gist 索引) 表 2:73 个特征(在 geom 字段上有 gist 索引) 表 1 和表 2 具有相同
枚举类型的值是该类型的静态变量。 据我所知,变量是由引用变量引用的,但没有新的运算符来实例化枚举对象。但这就像初始化数组一样吗? 这是对还是错? 最佳答案 是的,枚举类型的文字是 public sta
我阅读了有关关闭 zsh 自动更正以完成命令的所有提示。但是,它们并没有完全发挥作用。我试过 DISABLE_CORRECTION="true", unsetopt correct, unsetopt
我知道这个问题是 answered before ,但给出的答案并不是完整的故事: 我进入了 Firefox 的 Options->Content 并删除了除德语/德国之外的所有语言,navigato
我知道用汇编语言编写任何内容或将汇编语言添加到任何程序都会损害其可移植性。但是,有多糟糕呢?我的意思是,现在基本上所有 PC 都是 x86 或 x64,对吧?那么,如果我将汇编嵌入到 C 程序中,为什
我正计划构建一个 Web 服务客户端,它始终检查数据库中的某些记录,并根据数据库内容的结果在每个时刻及时执行某些决策。 所以我在想,我怎样才能让客户端一直运行呢? 我唯一想到的就是无限循环。像这样的东
我无法获取小部件的实际背景颜色。在我的特殊情况下,我在使用 QTabWidget 中的小部件时遇到了问题。 这是在 Windows7 上。所以经典小部件有一些灰色背景,而选项卡中的小部件通常用白色背景
请不要将我指向How to wrap preference title?因为它不适用于(正如我评论的那样)您使用 @strings/ 的情况对 strings.xml 文件的引用。 如果你使用 and
情况如下: 已知hdfs是仅附加的(本身没有更新)。 配置单元将数据写入其位于hdfs中的仓库。 可以在配置单元中执行更新 这意味着写入了新数据,旧数据应该以某种方式标记为已弃用,然后在某个时间将其清
在javascript中删除cookies的方法是将过期日期设置为过去。现在这实际上并没有删除 cookie,至少在 Firefox 中是这样。这只是意味着 cookie 将在浏览器关闭时被删除。 这
我需要终止一个卡住的线程,我将 IsBackground 设置为 true 但它仍然存在。线程的属性: ThreadState = AbortRequested IsBackground = true
在逻辑中,以及在 *ahem* 正确设计的编程语言中,将 boolean 值与 true 进行比较总是多余的,即 a == True 应该简单地替换为 a 。 (类似地, a == False 由 n
我一直在努力寻找一个好的定义,并理解线程到底是什么。 看来我一定错过了一些明显的东西,但是每次我读到什么是线程时,它几乎是一个循环定义,la“线程是一个执行线程”或“一种划分运行任务的方法” ”。呃呃
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
是否可以在 MAC 上以真正的全屏模式运行 IntelliJ Idea? 没有工具栏、侧边栏、按钮,只有代码。 如果可以,请告诉我。 最佳答案 您可以通过禁用以下项目在 View 菜单中执行此操作:
考虑以下代码: case class Vector3(var x: Float, var y: Float, var z: Float) { def add(v: Vector3): Unit =
我试图确认这个说法是否属实: 模型包括: 持久层:本质上是 DAO + 表示表的类 + DTO 服务层:DAOS + 一些逻辑的组合 您能否也引用/支持您的回答?我相信我在Spring Framewo
给定代码: #include struct X {}; struct Y1: virtual X {}; struct Y2: virtual X {}; struct Y3: virtual X
从这个其他QUESTION他们谈论 Bjarne Stroustrup 是如何说的,就像比 int 窄的整数数据类型(例如 short)被提升为 int,float 被提升为 double。但是,与i
我是一名优秀的程序员,十分优秀!