gpt4 book ai didi

java - 如何根据 hadoop 中的公共(public)键连接两个数据集?

转载 作者:可可西里 更新时间:2023-11-01 14:50:37 25 4
gpt4 key购买 nike

我有两个数据集 Customer 和 Goods。 Customer 数据集以客户 ID 作为键,以客户购买的商品 ID 列表作为值。 Goods 数据集以 good it 为键,以 price 为值。如何根据外键商品id加入这两个数据集?

customer dataset:
customer id, goods id1,goods id2, ...

goods dataset
goods id1, price1
goods id2, price2

The join result dataset I want:
customer id1,price1,price2,...
customer id2,pric3e,price4,...

我是 hadoop 的新手。我知道它可以在 Pig 和 Hive 中完成,但我想用 Hadoop 在 java 中实现它。有谁能够帮助我?非常感谢!

最佳答案

检查 Data-Intensive Text Processingwith MapReduce 中的 Relational Joins 部分文档。

关于java - 如何根据 hadoop 中的公共(public)键连接两个数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11609649/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com