algorithm - 如何存储和收集最近24小时、最近7天、最近30天、最近365天浏览次数最多的信息来挖掘？-6ren

algorithm - 如何存储和收集最近24小时、最近7天、最近30天、最近365天浏览次数最多的信息来挖掘？

转载作者：塔克拉玛干更新时间：2023-11-03 05:27:38

25

4

假设我们有一个高流量项目(一个管站点)，它应该使用此选项(不是实时)提供排序。视频数量约为200K，所有视频信息都存储在MySQL中。每日视频浏览量约为1.5KK。作为工具，我们有硬盘驱动器(文本文件)、MySQL、Redis。

Views
 top viewed
 top viewed last 24 hours
 top viewed last 7 days
 top viewed last 30 days
 top rated last 365 days

我应该如何存储这些信息？

第一个想法是记录对文本文件的所有访问(每小时一个文件，例如 visits_20080101_00.log)。在每小时开始时，计算前一小时每个视频的观看次数，并将此信息插入 MySQL。然后重新计算总数(过去 24 小时)并更新表格中的统计数据。在每天的开始，我们必须做同样的事情，但要重新计算过去 7 天、过去 30 天、过去 365 天。这种方法对我来说似乎很差，因为我们必须为每个视频存储最近 365 天的信息才能做出正确的计算。

还有其他好的方法吗？可能，我们必须为此选择其他工具？

谢谢。

最佳答案

如果绝对精度不重要，您可以汇总超过 2 个单位的信息。

您可以存储过去 1-2 小时的个人观看次数、过去 1-2 天的每小时观看次数(每小时一个值)，以及进一步的每日观看次数(每天一个值)。

“1-2”表示您存储到两个单元已满，然后汇总较早的单元。

关于algorithm - 如何存储和收集最近24小时、最近7天、最近30天、最近365天浏览次数最多的信息来挖掘？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2990575/

25

4

0

文章推荐： graphics - 3D 网格连接

文章推荐： c# - 为运输问题优化生成一系列非等成本的算法

文章推荐： java - 为什么 Logback 是 Spring Boot 中的默认日志记录框架？

文章推荐： python - 实用的基于Python的可视化编程环境？

javascript - 最多 3 位数字，最多 3 位小数
看来我又被一个简单的正则表达式卡住了。我想要什么: 1 到 999 之间的数字可选:逗号、符号如果输入逗号，最少1位小数，最多3位小数点应该是presebt。 Allowed: 100 999,
VBA:最多 2 列被发送到第三列
我需要从两列中获取最大值并将其发送到第三列。这些列的大小都是统一的，但有时大小会有所不同，但它们都将从同一个单元格开始。例如: 5 8 - 6 2 - 6 5 - 带有破折号的列需要找到其他两个之间的
MySQL，最多 3 个值
我在我的网站上有一张包含用户排名列的表格，排名是一个数字，我想选择排名最高的 3 个用户，所以我查看并搜索了我认为最好的查询是那:Link (正确答案的第二个查询)，但我不明白查询，如果有人能一步一步
php - 最多 24 小时更新数据库
我正在尝试制作一个点击计数器，我想收集 24 小时内的总点击次数。无论最终用户位于哪个时区，这 24 小时都应该是固定值。在 24 小时内，数据库应更新为 +1 次点击计数，一旦达到 24 小时时间范
php - 如何知道共享主机中哪些查询消耗的 CPU 最多？
我有一个在典型共享主机上运行的 PHP + MySQL Web 应用程序，我想知道调用最多的查询是什么以及消耗的资源量是多少。这样，我将专注于最昂贵的查询以优化资源或检测优化不佳的查询。例如: qu
c++ - 最多 2 位数字
这是我“尝试”从用户输入的数字中找到最大 2 个值的代码: #include using namespace std; void maximum2(int a, int& max1,int& max
python - 最多 'o' 个字符的单词
我需要编写一个 Python 函数，从具有最多“o”字符的字符串中返回单词。例如，get_most_ooo_word(['aa ao ooo']) 应该返回 ['ooo'] 和 get_most_oo
algorithm - 最多 255 个字符的字符串的非冲突哈希算法
我正在寻找一种哈希算法，以创建尽可能接近字符串的唯一哈希值 (max len = 255)，从而生成一个长整数 (DWORD)。我意识到26^255 >> 2^32，但也知道英语的单词数远少于2^3
string - 最多 n 个位置不同的字符串数？
我得到了一个仅由 's','t','u','v' 作为字符组成的字符串 T。我想找到长度为 |T| 的字符串数它最多与 T 不同 n 个位置。而且每个这样的字符串在三个不同的位置不能有相同的字符，这些
algorithm - 优化专家的工作分配，最多。每个专家的工作数量
我有一群“专家”(大约 300 人)可以胜任一项工作。而且我有很多工作必须完成，比如说大约 500 个。我也有信息，一个专家能做某项工作有多“好”。这将导致一个 300 x 500 的矩阵来保存权重。
c - 最多 K 个不匹配的子串？
我正在尝试解决这个问题，虽然我可以使用蛮力解决它，但是以下优化算法为我提供了一些测试用例的错误结果。我尝试了但无法找到代码的问题，任何人都可以帮助我。问题:给定一个字符串 S 和整数 K，找到整数
javascript - 最多 6 个字符的混合数字的正则表达式验证
我需要一个混合长度的正则表达式验证，总长度为 6 个字符，其中 4-6 个大写/数字字符和 0-2 个空格。我试过 ^[A-Z0-9]{4,6}+[\s]{0,2}$ 但它导致最大长度为 8 个字符
java - 最多 K 次交换的最小连续总和的程序是什么
我有一个数组 {-1,2,3,4,-3,-2,1,5} 现在我想找到给定数组的最小连续总和子数组，最多 K 次交换。在上面的数组中，最小连续和是-5，子数组是{-3,-2} 对于 K=1 我应该如何
hadoop - 最多 200 列的行交互式查询的最佳大数据解决方案是什么？
我们有一个简单的表格如下: ------------------------------------------------------------------------ | Name |
java - 最多 4 个字符的唯一哈希？
如果哈希不能超过 4 个字符，并且这 4 个字符只能是小写字母或数字，那么创建 String 哈希的最佳方法是什么？我要散列的字符串有 1-255 个字符。我知道在没有冲突的情况下创建 4-char
ios - 最多 45 个设备的多点连接框架
我希望使用 Multipeer Connectivity 框架，并感谢任何关于如何最好地进行的经验之谈。我需要在“教练”设备和最多 45 个“玩家”设备之间建立连接。他们都在同一个空间，但无法预测
ruby - 最多 n 的组合
给定一个数组 a，什么是实现其组合直到第 n 的最佳方法？例如: a = %i[a b c] n = 2 # Expected => [[], [:a], [:b], [:c], [:a, b], [
python - 大多数Pythonic方式打印*最多*一些小数位
这个问题在这里已经有了答案: Formatting floats without trailing zeros (21 个回答) 关闭8年前。我想格式化最多包含 2 个小数位的 float 列表。但
Docker 登录失败(最多 1 个参数)
我无法使用以下形式的命令登录到远程 docker 注册表: docker login –u my-username –p my-password registry.myclient.com 我得到的错
java - 您如何知道如何限制可以进入基本群聊应用程序服务器的客户端数量？ (最多 10 个)
所以这是我的代码:服务器.java import java.io.*; import java.net.*; import java.util.*; class Server implements R

首页

博学

6Ren·AI

商城

algorithm - 如何存储和收集最近24小时、最近7天、最近30天、最近365天浏览次数最多的信息来挖掘？