gpt4 book ai didi

Hadoop Mapper 运行缓慢

转载 作者:可可西里 更新时间:2023-11-01 16:19:02 26 4
gpt4 key购买 nike

我正在尝试同时使用映射器和缩减器来运行作业,但映射器运行缓慢..

如果对于相同的输入我禁用 reducers,映射器将在 3 分钟内完成而对于 mapper-reducer 作业,即使在 30 分钟后,Mappers 仍未完成。

我正在使用 hadoop 1.0.3 ..我尝试了压缩和不压缩 map 输出。我删除了旧版本的 hadoop 0.20.203 并从头开始为 1.0.3 重新安装了所有内容

Jobtracker 日志也​​充满了:

2012-10-03 10:26:20,138 INFO org.apache.hadoop.ipc.Server: IPC Server listener on 54311: readAndProcess threw exception java.lang.RuntimeException: readObject can't find class . Count of bytes read: 0
java.lang.RuntimeException: readObject can't find class
at org.apache.hadoop.io.ObjectWritable.readObject(ObjectWritable.java:185)
at org.apache.hadoop.ipc.RPC$Invocation.readFields(RPC.java:102)
at org.apache.hadoop.ipc.Server$Connection.processData(Server.java:1303)
at org.apache.hadoop.ipc.Server$Connection.processOneRpc(Server.java:1282)
at org.apache.hadoop.ipc.Server$Connection.readAndProcess(Server.java:1182)
at org.apache.hadoop.ipc.Server$Listener.doRead(Server.java:537)
at org.apache.hadoop.ipc.Server$Listener$Reader.run(Server.java:344)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1110)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:603)
at java.lang.Thread.run(Thread.java:679)
Caused by: java.lang.ClassNotFoundException:
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:264)
at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:820)
at org.apache.hadoop.io.ObjectWritable.readObject(ObjectWritable.java:183)

谁能告诉我哪里出了问题

最佳答案

如果您的映射器在 3 分钟内完成。那么它的批处理性质并不慢。是的,对于您使用的 mapreduce 版本,您需要确保您使用的是正确的 reducer。如果你的集群大小是 X 那么尝试使用 number of reducer 作为 X-1 。看看这是否有帮助

关于Hadoop Mapper 运行缓慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12711313/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com