java - hadoop 任务副作用文件

转载作者：可可西里更新时间：2023-11-01 15:41:29

26

4

我正在使用具有 0 个 Reduce 的 hadoop。目标是在 map 方法中逐步创建一个对象。然后在某个时候将其写入(序列化)到输出文件夹。就像我说的那样，reduce 部分不会在这里做任何事情。我该怎么做呢？这是我的:

在配置方法中，我得到文件的路径:

@Override
public void configure(JobConf conf) {      
  taskSideEffectFile = FileOutputFormat.getWorkOutputPath(conf) + "/temp";    
}

在 map 方法中，我正在构建我的对象，最终我想序列化它，现在我试图始终在 map 方法上编写它:

@Override
public void map(LongWritable key, Text value,
    OutputCollector<Text, IntWritable> output, Reporter reporter)
    throws IOException {        

  AddInstanceToClassifier(value.toString());

  try
  {             
    //serialize classifier
    weka.core.SerializationHelper.write( taskSideEffectFile, nb);

  }
  catch (Exception ex)
  {
    System.err.println("Failed to serialize classifier: " + ex.getMessage());
    throw new IOException("taskSideEffectFile: " + ex.getMessage());

  } 

}

这是我遇到的错误:

12/05/09 22:47:00 INFO mapred.JobClient:  map 0% reduce 0%
12/05/09 22:47:08 INFO mapred.JobClient: Task Id : attempt_201205091117_0015_m_000001_0, Status : FAILED
java.io.IOException: taskSideEffectFile: hdfs:/192.168.78.129:9000/user/hadoop-user/output/_temporary/_attempt_201205091117_0015_m_000001_0/temp (No such file or directory)
    at naive.bayes.hadoop.MusicClassifierMapper.SaveClassifier(MusicClassifierMapper.java:168)
    at naive.bayes.hadoop.MusicClassifierMapper.map(MusicClassifierMapper.java:121)
    at naive.bayes.hadoop.MusicClassifierMapper.map(MusicClassifierMapper.java:1)
    at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:47)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:227)
    at org.apache.hadoop.mapred.TaskTracker$Child.main(TaskTracker.java:2209)

注意:我正在使用 yahoo 的 hadoop-0.18.0(我认为这是我从 eclipse 运行应用程序的唯一方式)

最佳答案

Hadoop 应该存储您的临时文件，然后在任务成功时将它们“提升”到输出文件夹。

这里是你如何修复它

不再使用临时路径。
现在编写代码将其放在您创建的 HDFS 中的文件夹中

关于java - hadoop 任务副作用文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10527325/

26

4

0

文章推荐： java - Cloudera Hadoop VM 没有eclipse

文章推荐： hadoop - 在 hive 和 hadoop streaming-api 输出之间共享数据

文章推荐： c++ - C99 风格的 VLA 有哪些技术缺点？

文章推荐： java - 如何在hadoop 0.23.0 MR2上运行和编译java程序

Android Compose 副作用
这2个有什么区别？一个使用 SideEffect，另一个不使用。 “每次成功重组都会调用 SideEffect”，但如果没有 SideEffect，它也会在每次重组时运行。 @Composable f
javascript - innerHTML 副作用？
我在 DOM 元素引用方面遇到了一些问题，我想我已经追踪到它与更新 innerHTML 有关。在这个例子中，在第一次警告时，两个变量引用同一个元素，正如预期的那样。奇怪的是，在更新父元素(body)
javascript - 副作用/更改传递给函数的全局变量
如果有人问过这个问题，请原谅我，但我似乎找不到它。我正在尝试创建一个数组并反转它(不使用反转)这段代码完美运行: function reverseArrayInPlace(array) { fo
c# - Linq Any() 副作用
如果 reflector 是正确的(我倾向于相信它是正确的)，这就是 Any() 的实现: public static bool Any(this IEnumerable source) {
Python - 副作用/纯度分析工具？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，
c# - LINQ 副作用
是否可以用 LINQ 中的 lambda 表达式替换 foreach 循环 (.Select))？ List l = {1, 2, 3, 4, 5}; foreach (int i in l)
c - 副作用、序列点和未定义的行为
我在一本书上读到以下说法: n = ((i++) > (j)?(i++):(j)); 书上说假设i>j，n有一个意想不到的值，i增加了两次。我不明白为什么n在这句话之后有一个期望值。我读了很多关于
linux - LD_LIBRARY_PATH 副作用
我对更改 LD_LIBRARY_PATH 有奇怪的副作用。当我附加一个包含库的路径时，例如: LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/my_path/lib 然后，一切都
java - 副作用——这是什么？
有人能告诉我下面一行中“副作用”的含义吗？ If you're calling an EL function that doesn't return anything, then you're cal
javadoc - 如何记录 Java 副作用
是否有为包含副作用的 Java/JVM 语言方法编写 javadoc 的标准或最佳实践？我定义了一个 void 方法，它修改了方法参数之一，但不知道如何记录实际返回值(因为没有实际返回)。 /**
c - 副作用:strcmp() 是纯函数吗
我正在学习副作用和纯函数。我知道纯函数没有副作用，对于相同的参数，它们的返回值是相同的。我想知道 C 函数 strcmp() 是否是纯函数。我相信它是纯粹的，因为给定相同的两个字符串作为参数，结果将始
javascript - 扩展 Highmaps 副作用
我正在尝试创建佛罗里达州的点密度图。虽然我知道 Highmaps 不支持带有 map 点的颜色轴。我扩展了它并且它有效，但它带来了副作用。当我单击图例中的某一类别时，不会发生隐藏。例如，如果我单击“>
c - 奇怪的 sprintf 副作用？
我在 CS50 中研究 PSET 4，似乎遇到了 sprintf 更改不相关变量的问题。我只给出了没有揭示我的解决方案的代码...... #include #include #include t
C++ std::transform 副作用
我已经实现了这样的 UnaryOperation struct Converter { Converter( std::size_t value ): value_( valu
ios - 自定义 getter 副作用
使用点符号调用自定义 getter 是否有副作用？我一直在通过点符号在 Objective-C 中使用合成的 getter，即 tree.fruitnumber 返回树中果实的数量。我必须自定义 s
javascript - 产生*副作用*的表达式到底是什么？
我无法理解页面 https://developer.mozilla.org/en/JavaScript/Reference/Operators/Special/void 中的这一段: This ope
asp.net - 将应用程序池空闲超时设置为 0 副作用
我有一个在 IIS7 下运行的 Web 应用程序。我将全局变量存储在一个带有静态变量的类中。该类称为 SessionVariables 并且在其中例如我有以下内容: public class Sess
angular - ng-packagr 副作用 - 我应该担心吗？
运行命令时 ng-packagr -p ng-package.json 我得到以下输出 Building Angular library - - - skipped 8 lines - - - Sid
python - 使用补丁添加 OverflowError 副作用 - Python
我想模拟一个 OverflowError 因为我想在引发异常之后测试变量的值。但是，我不知道如何使用我正在使用的库复制 OverflowError。我在此特定测试中使用的库是 pysolar.sola
scala - 副作用 mutable.Map scala
当我尝试在可变 Map 中插入一个元素时，我希望这个元素插入到我的 Map 而不是返回 Map(如 PF，不可变对象(immutable对象) ecc ...)出于这个原因，我使用了可变集合，但在我的

首页

博学

6Ren·AI

商城

java - hadoop 任务副作用文件

这里是你如何修复它