gpt4 book ai didi

python - pycassa 多个键上的时间序列数据

转载 作者:太空宇宙 更新时间:2023-11-03 19:13:24 25 4
gpt4 key购买 nike

我正在尝试为 Twitter 克隆制作新闻源 - 显示选定用户的最新推文,而不是所有用户的最新推文或单个用户的最新推文。

我将 UUID key 存储在各个 key 中,例如:

user1, {UUID01: '', UUID02: '', UUID03: '', UUID04: ''}
user2, {UUID05: '', UUID06: '', UUID07: '', UUID08: ''}
user3, {UUID09: '', UUID10: '', UUID11: '', UUID12: ''}
user4, {UUID13: '', UUID14: '', UUID15: '', UUID16: ''}

最后每个 UUID 都与另一个列族中的一条推文相关:

UUID01, { ... }
UUID02, { ... }
UUID03, { ... }

现在,我可以有效地获取所有用户或单个用户的推文时间排序。但是如何获取 user1、user2 和 user3 等按时间排序的事件?

请注意,用户 1 可能有很多新推文,但用户 2 可能有很少的新推文。

我曾考虑过创建一个“新闻源”列族,其中包含用户所关注的所有用户的推文的 UUID,但这种纯粹的数据冗余水平似乎……太过分了。这是一个更明智的方法吗?

最佳答案

在客户端上排序(合并),或复制到单独的新闻源中,基本上是您的两个选择。选择你的毒药。

FWIW,我看到一篇我找不到的研究论文,分析哪个更好。结论是,在推文数量达到一定阈值时,复制效果更好。 (每个用户约 10000 个,IIRC。)

关于python - pycassa 多个键上的时间序列数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12187168/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com