gpt4 book ai didi

hadoop - 使用 HBase 进行分析

转载 作者:可可西里 更新时间:2023-11-01 14:50:45 24 4
gpt4 key购买 nike

我几乎是 HBase 的新手。我想采用基于 MySQL 的当前站点跟踪并将其放入 HBase,因为 MySQL 根本无法再扩展。

我完全迷失了第一步......

我需要跟踪用户的不同操作,并且需要能够按某些方面(日期、他们来自的国家/地区、他们执行操作时使用的产品等)汇总它们

我目前存储它的方式是,我有一个包含所有这些方面(国家/地区、日期、产品...)的复合 PK 的表格,其余字段是操作的计数器。当一个 Action 被执行时,我将它插入到表中,将 Action 的列递增一个(ON DUPLICATE KEY UPDATE...)。

*date      | *country | *product | visited | liked | put_to_basket | purchased
2011-11-11 | US | 123 | 2 | 1 | 0 | 0
2011-11-11 | GB | 123 | 23 | 10 | 5 | 4
2011-11-12 | GB | 555 | 54 | 0 | 10 | 2

我有一种感觉,这完全违背了 HBase 的方式,而且也没有真正扩展(如果键插入变得昂贵,则数量会增加)并且不是很灵活。

如何在HBase中通过it属性有效追踪用户行为?表格应该是什么样子的?图片中的 MapReduce 在哪里?

感谢所有建议!

最佳答案

Lars George 的“HBASE:权威指南”解释了一个与您想要实现的目标非常相似的设计 in the introduction chapter

关于hadoop - 使用 HBase 进行分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8172427/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com