gpt4 book ai didi

Cassandra 更改主键与触发多个选择查询

转载 作者:行者123 更新时间:2023-12-03 08:02:15 25 4
gpt4 key购买 nike

我有一个表,用于存储用户拥有的产品列表。表格看起来像这样。

create table my_keyspace.userproducts{
userid,
username,
productid,
productname,
producttype,
Primary Key(userid)
}

所有用户都属于一个组,一个组中最少有 1 到最多 100 个用户

userid|groupid|groupname|
1 |g1 | grp1
2 |g2 | grp2
3 |g3 | grp3

我们有新要求,要为单个组中的所有用户显示所有产品。

那么我是否需要更改我的 userproducts,以便我的分区键现在为 groupid 并将 userid 作为我的集群键,以便我可以在一个查询中获得所有结果。

或者我是否保持表设计不变,并通过从第二个表中选择一组中的所有用户来触发多个选择查询,然后为每个用户触发一个选择查询,合并代码中的数据,然后将其返回给用户

谢谢。

最佳答案

即使在回答您的问题之前,您提出的数据建模也存在问题:您说您想要存储“用户拥有的产品列表”。但这不是您提供的表格所具有的内容 - 您的表格为每个用户 ID 提供了一个产品。 “userid”是表的键,表中的每个条目(即每个唯一的用户 ID)都具有其他字段的一种组合。

如果您确实希望每个用户都有一个产品列表,则需要将主键设置为(userid, Productid)。这意味着每条记录都由用户 ID 和产品 ID 进行索引,或者换句话说,用户 ID 有一个记录列表,每个记录都有自己的产品 ID。 Cassandra 允许您高效地获取单个用户 ID 的所有 ProductID 记录,因为它将键的第一部分实现为“分区键”,但第二部分是“集群键”。

关于您的实际问题,您确实有两个选择:要么对原始表进行多次查询,要么进行所谓的非规范化,即创建第二个表,其中包含您想要立即搜索的内容。对于第二个选项,您可以手动执行此操作(每次有新数据时更新两个表),也可以让 Cassandra 使用名为物化 View 的功能自动为您更新第二个表。

使用两个选项中的哪一个(多个查询或多个更新)实际上取决于您的工作负载。如果它有很多更新和很少的查询,那么最好快速保留更新并减慢查询速度。另一方面,如果更新很少但查询很多,则最好使更新速度变慢(当每次更新都需要更新两个表时)但使查询速度更快。另一个重要问题是多少查询延迟对您来说很重要 - 多个查询选项不仅会增加集群上的负载(您可以通过在问题上投入更多硬件来解决),还会增加延迟 - 这是一个不会解决的问题远离更多硬件,对于某些用例可能会成为问题。

您还可以通过使用辅助索引功能在 Cassandra 中实现类似的目标,该功能具有自己的性能特征(在某些方面类似于“多个查询”解决方案)。

关于Cassandra 更改主键与触发多个选择查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54086837/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com