gpt4 book ai didi

hadoop - 使用 hadoop-mongo 和 PIG 更新 Mongo 集合

转载 作者:行者123 更新时间:2023-12-02 21:53:09 25 4
gpt4 key购买 nike

我正在使用 mongo-hadoop 项目并使用 PIG 来实现以下目标。

现在,我有 2 个 pig LOAD 语句,两者都将 catid 作为公共(public)字段,所有其他字段都是唯一的。我希望创建 1 条记录,但同时包含两者的字段。

例如:

Collection1: { catid, key1, key2 }

Collection2: { catid, key3, key4 }

以及要存储在 mongo 集合中的输出为:
_id, catid, key1, key2, key3, key4.

我试过:
STORE A INTO '$DB.tablename' USING com.mongodb.hadoop.pig.MongoStorage('update [catid]','{catid:1},{unique:false}');

STORE B INTO '$DB.tablename' USING com.mongodb.hadoop.pig.MongoStorage('update [catid]','{catid:1},{unique:false}');

但它总是插入。 A、B 有 10 条记录有共同的 catid,mongo 中的输出是 20 条记录。它没有更新。对此有什么帮助吗?谢谢。

最佳答案

关于hadoop - 使用 hadoop-mongo 和 PIG 更新 Mongo 集合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18222308/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com