gpt4 book ai didi

hadoop - Cassandra/Hadoop 重复尝试消息

转载 作者:可可西里 更新时间:2023-11-01 15:39:21 26 4
gpt4 key购买 nike

在 Pig 中发出转储后,我在控制台上看到以下消息。我之前已经将超过 1500 万条记录的 Cassandra 表中的数据加载到 pig 关系中。

我正在运行一个 5 节点的 Hadoop 集群,所有节点都显示如下相同的消息;

信息 14:16:22,225 attempt_201310071219_0003_m_000001_0 NaN%信息 14:16:25,294 attempt_201310071219_0003_m_000001_0 NaN%信息 14:16:28,366 attempt_201310071219_0003_m_000001_0 NaN%信息 14:16:31,434 attempt_201310071219_0003_m_000001_0 NaN%

有人可以解释一下吗?

查看 Web 浏览器中的作业详细信息,我可以看到 map 和 reduce 任务的数量设置为 1。我的印象是 map 和 reduce 任务分布在 5 个节点上,而不是只有一个节点做所有的工作?

更新:

我已按照建议在一个 Hadoop 节点(500 万个项目)上运行测试,在 Pig 中发出转储后我仍然看到相同的消息...

INFO 15:55:15,448 JVM ID:jvm_201310141552_0001_m_-2064359790 给定任务:attempt_201310141552_0001_m_000002_0 信息 15:55:20,395 attempt_201310141552_0001_m_000002_0 0.0% 设置 信息 15:55:20,397 任务 attempt_201310141552_0001_m_000002_0 已完成。 INFO 15:55:20,398 报告的 attempt_201310141552_0001_m_000002_0 的输出大小为 -1 信息 15:55:20,398 addFreeSlot:当前空闲插槽:1 信息 15:55:21,021 任务“attempt_201310141552_0001_m_000002_0”已成功完成 task_201310141552_0001_m_000002。 信息 15:55:21,031 添加任务 (MAP) 'attempt_201310141552_0001_m_000000_0' 到 tip task_201310141552_0001_m_000000,用于跟踪器 'tracker_CassENT.eveng.local:/10.xxxxx:46522' 信息 15:55:21,033 选择数据本地任务 task_201310141552_0001_m_000000 信息 15:55:21,035 LaunchTaskAction (registerTask): attempt_201310141552_0001_m_000000_0 任务状态:未分配 INFO 15:55:21,035 尝试启动:attempt_201310141552_0001_m_000000_0 需要 1 个插槽 信息 15:55:21,035 收到任务的 KillTask​​Action:attempt_201310141552_0001_m_000002_0 信息 15:55:21,036 在 TaskLauncher 中,当前空闲插槽:1 并尝试启动需要 1 个插槽的 attempt_201310141552_0001_m_000000_0 信息 15:55:21,036 即将清除任务:attempt_201310141552_0001_m_000002_0 信息 15:55:21,037 在缓存中找不到 map ID attempt_201310141552_0001_m_000002_0 信息 15:55:21,050 没有为 jobId/taskid 生成新的 JVM:job_201310141552_0001/attempt_201310141552_0001_m_000000_0。尝试重用:jvm_201310141552_0001_m_-2064359790 INFO 15:55:21,421 具有 ID 的 JVM:jvm_201310141552_0001_m_-2064359790 给定任务:attempt_201310141552_0001_m_000000_0 信息 15:55:24,865 ParNew GC:1 次收集 216 毫秒,使用 89930816;最大值为 3200253952 信息 15:55:27,708 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:55:30,759 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:55:33,801 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:55:36,860 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:55:39,940 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:55:42,989 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:55:46,043 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:55:49,836 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:55:52,874 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:55:55,913 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:55:58,958 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:56:02,068 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:56:05,128 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:56:08,184 attempt_201310141552_0001_m_000000_0 NaN% 信息 15:56:11,243 attempt_201310141552_0001_m_000000_0 NaN%

为什么会这样?

谢谢马吉德

最佳答案

您的集群设置似乎有问题。可以发一下你的戒指信息吗?能不能先在一个节点上测试,然后再进行多节点测试。

关于hadoop - Cassandra/Hadoop 重复尝试消息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19284107/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com