gpt4 book ai didi

algorithm - 如何存储和收集最近24小时、最近7天、最近30天、最近365天浏览次数最多的信息来挖掘?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:27:38 25 4
gpt4 key购买 nike

假设我们有一个高流量项目(一个管站点),它应该使用此选项(不是实时)提供排序。视频数量约为200K,所有视频信息都存储在MySQL中。每日视频浏览量约为1.5KK。作为工具,我们有硬盘驱动器(文本文件)MySQLRedis

Views
top viewed
top viewed last 24 hours
top viewed last 7 days
top viewed last 30 days
top rated last 365 days

我应该如何存储这些信息?

第一个想法是记录对文本文件的所有访问(每小时一个文件,例如 visits_20080101_00.log)。在每小时开始时,计算前一小时每个视频的观看次数,并将此信息插入 MySQL。然后重新计算总数(过去 24 小时)并更新表格中的统计数据。在每天的开始,我们必须做同样的事情,但要重新计算过去 7 天、过去 30 天、过去 365 天。这种方法对我来说似乎很差,因为我们必须为每个视频存储最近 365 天的信息才能做出正确的计算。

还有其他好的方法吗?可能,我们必须为此选择其他工具?

谢谢。

最佳答案

如果绝对精度不重要,您可以汇总超过 2 个单位的信息。

您可以存储过去 1-2 小时的个人观看次数、过去 1-2 天的每小时观看次数(每小时一个值),以及进一步的每日观看次数(每天一个值)。

“1-2”表示您存储到两个单元已满,然后汇总较早的单元。

关于algorithm - 如何存储和收集最近24小时、最近7天、最近30天、最近365天浏览次数最多的信息来挖掘?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2990575/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com