gpt4 book ai didi

mongodb - Hadoop 错误 - 无法计算输入拆分 : need to login

转载 作者:可可西里 更新时间:2023-11-01 15:17:36 36 4
gpt4 key购买 nike

我正在尝试 Hadoop 在我的数据中应用 Map Reduce,示例 in this link当我为正确的 mongo.input.uri 配置本地 mongo 集合时工作正常。

但是当我如下所示配置远程 mongo 集合时,

  <property>
<name>mongo.input.uri</name>
<value>mongodb://username:password@remote_mongodb_ip:27017/input_collection</value>
</property>

我得到以下错误

java.lang.IllegalArgumentException: Unable to calculate input splits: need to login

最奇怪的是,如果我为输入表和输出表的远程 mongo 数据库集合使用与上述相同的语法格式。

对此有什么建议吗?

最佳答案

拆分非分片集合需要 splitVector 命令,并且需要管理员凭据。

有几种解决方法:

  • 如果集合很小并且您可以在没有多个拆分的并行性的情况下进行处理,则可以通过将 mongo.input.split.create_input_splits 设置为 false 来关闭输入拆分并在单个拆分中一次处理整个集合。
  • 如果您可以对集合进行分片,分片上的 block 范围将用作拆分边界。然后不再需要 splitVector 命令,只需要对 block 集合的读取权限。

关于mongodb - Hadoop 错误 - 无法计算输入拆分 : need to login,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16916146/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com