gpt4 book ai didi

hadoop - 自定义输入格式,hadoop c++​​ 管道

转载 作者:可可西里 更新时间:2023-11-01 14:41:45 25 4
gpt4 key购买 nike

我想使用 hadoop c++​​ 管道来创建我的 may/reduce 代码。而且输入数据是二进制的,我想自定义输入格式来控制 getSplits 逻辑……但我不确定这是否是一个可能的解决方案。我尝试在 cli 中分配我的自定义输入格式类,但未能运行。

../bin/hadoop pipes -conf testframework.xml -input input -output output -inputformat TestInputFormat.class

我遇到以下错误:

Exception in thread "main" java.lang.ClassNotFoundException: TestInputFormat.class
at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
at java.lang.ClassLoader.loadClass(ClassLoader.java:306)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301)
at java.lang.ClassLoader.loadClass(ClassLoader.java:247)
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:247)
at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:812)
at org.apache.hadoop.mapred.pipes.Submitter.getClass(Submitter.java:372)
at org.apache.hadoop.mapred.pipes.Submitter.run(Submitter.java:421)
at org.apache.hadoop.mapred.pipes.Submitter.main(Submitter.java:494)

这有意义吗?

最佳答案

我认为您的问题只是末尾的 .class。但是,如果您已经尝试删除它。你可以尝试我所做的来解决这个问题。我打包成一个 .jar (jar cf libJar.jar packageName)。我使用 -libjars 和 -inputformat packageName.TestInputFormat 来引用它。我希望这会有所帮助。

编辑 1

另一种方法是使用 -D mapred.input.format.class=packageName.TestInputFormat

关于hadoop - 自定义输入格式,hadoop c++​​ 管道,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14232301/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com