gpt4 book ai didi

用于 Web 日志记录的 cassandra 数据模型

转载 作者:行者123 更新时间:2023-12-04 06:12:26 26 4
gpt4 key购买 nike

一直在玩 Cassandra,我正在尝试评估什么是最好的数据模型,用于存储诸如 View 或唯一页面 ID 的点击等内容?每个pageid最好有一个列族,还是1个带有pageid列的 super 列(日志)?每个页面都有一个唯一的 id,然后想在 View 上存储日期和其他一些指标。

我只是不确定哪种解决方案可以处理更好的可扩展性、大量列族或 1 个巨型 super 列?

page-92838 { 日期:9 月 2 日,浏览器:IE }
page-22939 { 日期:9 月 2 日,浏览器:IE5 }

或者

日志{
第92838页{
日期:9月2日,
浏览器:IE
}
第22939页{
日期:9月2日,
浏览器:IE5
}
}

其次,如何处理许多不同的日期:92838 页的条目?

最佳答案

使用 cassandra,最好从您需要执行的查询开始,并为您的架构建模以支持这些查询。

假设您想查询页面上的点击量,以及浏览器的点击量,您可以有一个 counter column对于每个页面,

stats { #cf 
page-id { #key
hits : # counter column for hits
browser-ie : #counts of views with ie
browser-firefox : ....
}
}

如果您需要进行基于时间的查询,请查看 twitters rainbird denormalizes当它写入 cassandra 时。

关于用于 Web 日志记录的 cassandra 数据模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7627050/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com