gpt4 book ai didi

cassandra - twissandra 数据模型是否有效?

转载 作者:行者123 更新时间:2023-12-01 13:47:35 24 4
gpt4 key购买 nike

请帮帮我,我是 cassandra 世界的新手,所以我需要一些建议。

我正在尝试为 cassandra DB 制作数据模型。

在我的项目中我有- 可以互相关注的用户,- 可以与许多主题相关的文章。

每个用户可以关注多个主题。

因此,我们的目标是制作用户将获得的聚合提要:他关注的所有主题的文章 +他关注的所有 friend 的文章 + self 文章。

我搜索了相同的任务并找到了 twissandra 示例项目。

正如我在那个例子中所理解的那样,我们只在时间线中存储推文的 ID,当我们需要获取时间线时,我们获取推文的 ID,然后在单独的非阻塞请求中通过 ID 获取每条推文。收集完所有推文后,我们将推文列表返回给用户。

所以我的问题是:它有效率吗?

向数据库发出约 41 次请求以获取一页推文?

第二个问题是关于追随者的。当有人创建推文时,我们会获取他的所有关注者并将推文 ID 放入他们的时间轴,但是如果用户有成千上万的关注者怎么办?

这意味着为了只创建一条推文,我们应该向数据库写入 (1+followers_count) 次?

最佳答案

twissandra 更像是一个玩具示例。它适用于某些工作负载,但您可能需要更多地对数据进行更多分区(分解大行)。

基本上虽然是,但它相当有效 - 通过将内容包含在时间轴中可以使效率更高,但取决于可能不是一个好主意的要求(如果需要删除/编辑)。写入应该不是问题,如果您有足够的系统,20k 写入/秒/节点是合理的。

如果我正确理解您的用例,您可能会很好地使用 twissandra 之类的架构,但请务必使用预期的工作负载对其进行测试。请记住,在一定规模上,一切都会变得更加复杂(即,如果您预计有数百万篇文章,您将需要进一步分区,请参阅 https://academy.datastax.com/demos/getting-started-time-series-data-modeling)。

关于cassandra - twissandra 数据模型是否有效?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34743996/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com