hadoop - 运行 mapreduce 作业时无法连接到 Zookeeper-6ren

hadoop - 运行 mapreduce 作业时无法连接到 Zookeeper

转载作者：可可西里更新时间：2023-11-01 16:48:17

26

4

我正在使用 Accumulo 表作为输入运行 map reduce 作业，并将数据存储在 Accumulo 中的另一个表中。这是运行方法

public int run(String[] args) throws Exception {

        Opts opts = new Opts();
        opts.parseArgs(PivotTable.class.getName(), args);

        Configuration conf = getConf();

        conf.set("formula", opts.formula);

        Job job = Job.getInstance(conf);

        job.setJobName("Pivot Table Generation");
        job.setJarByClass(PivotTable.class);

        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(Text.class);

        job.setMapperClass(PivotTableMapper.class);
        job.setCombinerClass(PivotTableCombiber.class);
        job.setReducerClass(PivotTableReducer.class);

        AccumuloInputFormat.setInputTableName(job, opts.dataTable);

        BatchWriterConfig bwConfig = new BatchWriterConfig();

        AccumuloOutputFormat.setBatchWriterOptions(job, bwConfig);
        AccumuloOutputFormat.setDefaultTableName(job, opts.pivotTable);
        AccumuloOutputFormat.setCreateTables(job, true);

        job.setInputFormatClass(AccumuloInputFormat.class);
        job.setOutputFormatClass(AccumuloOutputFormat.class);

        opts.setAccumuloConfigs(job);

        return job.waitForCompletion(true) ? 0 : 1;
    }

但问题是，当我运行该作业时，我收到一个异常，提示它无法连接到 zookeeper。

Error: java.lang.RuntimeException: Failed to connect to zookeeper (zookeeper.1:22181) within 2x zookeeper timeout period 30000
        at org.apache.accumulo.fate.zookeeper.ZooSession.connect(ZooSession.java:124)
        at org.apache.accumulo.fate.zookeeper.ZooSession.getSession(ZooSession.java:164)
        at org.apache.accumulo.fate.zookeeper.ZooReader.getSession(ZooReader.java:43)
        at org.apache.accumulo.fate.zookeeper.ZooReader.getZooKeeper(ZooReader.java:47)
        at org.apache.accumulo.fate.zookeeper.ZooCache.getZooKeeper(ZooCache.java:59)
        at org.apache.accumulo.fate.zookeeper.ZooCache.retry(ZooCache.java:159)
        at org.apache.accumulo.fate.zookeeper.ZooCache.get(ZooCache.java:289)
        at org.apache.accumulo.fate.zookeeper.ZooCache.get(ZooCache.java:238)
        at org.apache.accumulo.core.client.ZooKeeperInstance.getInstanceID(ZooKeeperInstance.java:169)
        at org.apache.accumulo.core.client.ZooKeeperInstance.<init>(ZooKeeperInstance.java:159)
        at org.apache.accumulo.core.client.ZooKeeperInstance.<init>(ZooKeeperInstance.java:140)
        at org.apache.accumulo.core.client.mapreduce.RangeInputSplit.getInstance(RangeInputSplit.java:364)
        at org.apache.accumulo.core.client.mapreduce.AbstractInputFormat$AbstractRecordReader.initialize(AbstractInputFormat.java:495)
        at org.apache.hadoop.mapred.MapTask$NewTrackingRecordReader.initialize(MapTask.java:548)
        at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:786)
        at org.apache.hadoop.mapred.MapTask.run(MapTask.java:341)
        at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:164)
        at java.security.AccessController.doPrivileged(Native Method)
        at javax.security.auth.Subject.doAs(Subject.java:422)
        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1657)
        at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:158)

我检查了 zookeeper 是否已启动并且正在运行。我运行 telnet 以查看端口是否已启动并且已启动。

我正在使用 $ACCUMULO_HOME/bin/tool.sh 来运行作业。任何帮助将不胜感激。

最佳答案

这是我的 hadoop slaves 中的主机文件的问题。主机名映射不正确。

关于hadoop - 运行 mapreduce 作业时无法连接到 Zookeeper，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34847188/

26

4

0

文章推荐： java - 如何在 Eclipse 中设置 http 代理？

文章推荐： c++ - 在嵌套 Lambda 中使用 `decltype` 时出现 GCC 段错误

文章推荐： javascript - 如果 session 是新的，我如何 checkin JavaScript？

文章推荐： hadoop - 运行 Map Reduce 作业时获取 ClassCastException

apache-zookeeper - Zookeeper - 在哪里可以找到正在运行的 Zookeeper 实例的 "real"版本？
我最近安装了一个带有 Exhibitor 的新 ZK 节点，它开始正常。当我执行 telnet localhost 2181 然后运行 stats 以查看版本时，即使我安装了 3.4.11，我仍然
apache-zookeeper - 如何通过 Zookeeper shell 以 'super' 用户身份访问 Zookeeper 集合？
每 the zookeeper docs , 可以创建一种以“ super ”用户身份访问 Zookeeper 集合的方法。这样做的方向在配置和连接方法方面都有些模糊。它确实巧妙地表明这只能通过 Ja
apache-zookeeper - Zookeeper，数据版本控制
场景如下: Znode 创建:create/config 12345(例如创建于12/12/12) 更新此配置，设置/config 34567(例如在 2013 年 12 月 12 日修改) 一个月后
apache-zookeeper - zookeeper 检查特定服务器是否是领导者
使用Zookeeper API，是否可以知道当前服务器是否是Zookeeper集群的leader？文档提到领导者看到了所有追随者中最高的zxid。。是否有可能以某种方式检查？最佳答案您可以从不同
apache-zookeeper - ZooKeeper 快照文件是否足以恢复状态？
我正在学习 ZooKeeper 并研究备份存储在 ZooKeeper 中的数据的选项。 ZooKeeper 写入两个数据文件，快照和事务日志。人们经常提到快照是“模糊的”，需要重放事务日志以获取最新状
apache-zookeeper - ZooKeeper 集成集群中的最大服务器数？
用例:一个池中有 100 个服务器；我想在每个服务器上启动一个 ZooKeeper 服务，服务器应用程序(ZooKeeper 客户端)将使用 ZooKeeper 集群(读/写)。那么就没有单点故障。
apache-zookeeper - Zookeeper 数据目录清理
我正在运行 3 节点 zookeeper 集群来处理 Storm 和 kafka.Zookeeper 数据目录占用了我系统中的所有空间。我不知道如何清理它。因为，我不想完全删除数据，因为我会丢失进程的
apache-zookeeper - Zookeeper 整体数据大小限制
我是 Zookeeper 的新手，试图了解它是否适合我的用例。我有 1000 万个分层数据，我想将它们存储在 Zookeeper 中。 10M 键值对，键值对大小分别为 1KB。因此，在没有复
apache-zookeeper - ZooKeeper 如何提供顺序一致性
在 here 有人说: "even if you read from a different follower every time, you'll never see version 3 of th
apache-zookeeper - Zookeeper 临时节点是否写入磁盘？
Zookeeper 临时节点是否写入磁盘？我知道在 Zookeeper 确认写入客户端之前，正常的 Zookeeper 节点已写入磁盘。但是，临时节点仅在客户端 session 期间持续，因此如果
apache-zookeeper - Zookeeper 自动清除功能不起作用
在开发阶段使用zookeeper大约6个月后，虽然运行良好，但其数据目录的大小增长到 6 GIG !而且还在增加。下面列出了一些系统规范: zookeeper version: 3.4.6 numbe
apache-zookeeper - ZooKeeper 在裂脑场景中的内部行为
我试图了解 Apache ZooKeeper 在裂脑情况下的内部工作原理。假设有一个由 5 个服务器组成的集群:A、B、C、D 和 E，其中 A 是领导者。现在假设子簇 {A, B} 与子簇 {C,
apache-zookeeper - Zookeeper 法定人数和非法定人数
动物园管理员专家。我问的问题对你来说可能很基础，但我是 ZK 的新手，我还没有掌握该工具，所以请原谅。考虑到这一点，这是我的问题。假设我有一个由 5 个服务器组成的 ZK 集群，我有 3 个法定人
apache-zookeeper - Zookeeper 中的分层仲裁
我正在尝试了解 Zookeeper 中的分层仲裁。文档 here 举了一个例子，但我仍然不确定我是否理解它。我的问题是，如果我有一个双节点 Zookeeper 集群(我知道不推荐这样做，但为了这个例子
apache-zookeeper - Zookeeper 连接超时问题
我们使用的是2.3.0版本的curator-framework连接pom文件中的zookeeper。 org.apache.curator curator-fram
apache-zookeeper - Zookeeper 连接错误
我们在开发机器上有一个独立的 zookeeper 设置。除了这台 testdev 机器之外，它适用于所有其他开发机器。尝试通过 testdev 连接到 zookeeper 时，我们一遍又一遍地收到此
apache-zookeeper - Zookeeper 事务日志变得非常大
zookeeper 事务日志变得非常大(数千兆字节!)并且集群的每台机器中始终存在一个或最多两个事务日志文件，因为知道可能存在多个快照! .. 引入 autopurge.purgeInterval 和
org.apache.flink.shaded.zookeeper.org.apache.zookeeper.ZooKeeper.getSessionId()方法的使用及代码示例
本文整理了Java中org.apache.flink.shaded.zookeeper.org.apache.zookeeper.ZooKeeper.getSessionId()方法的一些代码示例，展
apache-zookeeper - 使用 zookeeper-shell.sh 验证 path(znode) 是否存在于 zookeeper 中
我需要一些帮助来使用 zookeeper-shell.sh 验证 znode(path) 是否存在于 zookeeper 中示例:bin/zookeeper-shell.sh zk:9091 ls/
apache-zookeeper - Zookeeper 通信协议(protocol)
我需要使用 tcpdump 调试我的 kafka 消费者和 zookeeper 之间交换的数据。我浏览了 zookeeper 文档，但找不到任何关于 zookeeper 通信协议(protocol)的

首页

博学

6Ren·AI

商城

hadoop - 运行 mapreduce 作业时无法连接到 Zookeeper