mysql - 如何建模数据库以处理多个时区的计数器-6ren

mysql - 如何建模数据库以处理多个时区的计数器

转载作者：行者123 更新时间：2023-11-29 00:15:03

25

4

我有一个包含分析信息的表格，即:每个页面上的页面浏览量。

field        type
---------------------------
page_id          long
created_time     long (epoch UTC - rounded by hour)
page_views       long

我将纪元向下舍入到小时(例如:1398456553 ==> 1398456000)，允许该表每小时汇总信息。

当客户请求他们的数据时，我们可以进行适当的调整，让他/她能够在他们本地的时区看到数据。

如果客户端的本地时区是UTC，查询很简单:

SELECT
    FROM_UNIXTIME(st.`created_time`, '%Y-%m-%d') AS created_at,
    SUM(st.`page_views`) AS page_views
FROM `page_stats` st
WHERE st.`created_time` 
    BETWEEN 1396310400 -- 01 Apr 2014 00:00:00 GMT
    AND 1397088000 -- 10 Apr 2014 00:00:00 GMT
GROUP BY created_at;

如果客户的时区在其他地方(例如:-03:00)，查询需要更多操作，以调整日期以更正 TZ:

SELECT
    DATE_FORMAT(CONVERT_TZ(FROM_UNIXTIME(st.`created_time`), '+00:00', '-03:00'), '%Y-%m-%d') AS created_at,
    SUM(st.`page_views`) AS page_views
FROM `page_stats` st
WHERE st.`created_time` 
    BETWEEN 1396321200 -- 01 Apr 2014 03:00:00 GMT
    AND 1397098800 -- 10 Apr 2014 03:00:00 GMT
GROUP BY created_at;

这种方法适用于小周期(< 30 天)，但当日期范围代表几个月时，它的扩展性很差，因为要选择的行数以及 DATE_FORMAT 等函数需要转换。

理想的数据粒度是DAY，但我无法按天创建聚合表，因为按天汇总在每个 TZ 上都不同。

为表建模以在大型数据集上提供 TZ 保真度的正确方法应该是什么？

值得注意的是，我可以在这个组上允许一些错误(< 2%)，也许一些 Probabilist Data Structure 可能有助于解决问题，但我还没有弄清楚。

最佳答案

首先，请注意 TimeZone != Offset。查看timezone tag wiki .

其次，如果您要按多个时区的目标日期进行聚合，您可能只想选择几个相关时区并将它们的本地日期预先计算到数据中的唯一列中。然后在查询时很容易聚合。当然，如果你想支持 the IANA tzdb 中的所有 500 多个时区，这个策略就站不住脚了。 .

另一种策略是舍入构建另一组表，将项目预先聚合到 15 分钟的桶中。为什么是15分钟？因为并非所有时区偏移量都是以整小时为单位的。考虑在委内瑞拉使用 -4:30，在印度使用 +5:30，在尼泊尔使用 +5:45，在澳大利亚部分地区使用 +8:45。获得这些预聚合后，您可以在查询时将那些转换为特定客户端时区的详细信息。

最后，您可能会认为像 MySQL 这样的关系数据库可能不是完成这项特定工作的最佳工具。一个 OLAP 多维数据集可以很好地工作，因此可以在几个 nosql 数据库中的任何一个中使用 map/reduce 函数。您可能希望将数据从 MySQL 复制到单独的“报告存储”或“数据仓库”，并从那里进行查询。

关于mysql - 如何建模数据库以处理多个时区的计数器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23303203/

25

4

0

文章推荐： mysql - 按升序返回行

文章推荐： mysql - INSERT 语句的动态值选择

文章推荐： php - 复选框和 MySQL

c++ - map 计数器；计数器[nums[i]]++；
我在leetcode上看到这段代码，是一道求众数的题，下面是题目描述: 给定一个大小为 n 的数组，找到多数元素。众数元素是出现次数超过 ⌊ n/2 ⌋ 次的元素。你可以假设数组是非空的并且多数元素
JavaScript 计数器
每次在 JavaScript 中执行特定操作时，例如: $(function() { $('#typing').keyup(function () { switch($(this)
用于大小数字的 Javascript 计数器
我一直在为网页设计一个计数器，但我一直被这个我无法解决的功能所困扰。我有一个 4 个 div 的计数器，因为其中两个是小数字，另外两个是大数字，所以第一个运行得很快，我看不到它们的功能。有人知道如
Jquery every() 计数器
我已经在文档中进行了一些搜索，并在网上花了一段时间，但找不到解决方案!我希望警报告诉我单击 .thumb 时它处于each() 的哪一次迭代。 EG:有六个.thumb，我点击数字3，浏览器弹出3!
javascript - Handlebars 计数器#each
在 Handlebars 中，假设我有 names 的集合.我能怎么做 {{#each names}} {{position}} {{name}} {{/each}} 在哪里 {{position}}
r - 为数据帧的每组中的行创建一个序列号(计数器)
这个问题在这里已经有了答案: Numbering rows within groups in a data frame (9 个回答) 4年前关闭。我们如何在数据帧的每组中生成唯一的 ID 号？以下
数字序列的 SAS 计数器
我正在努力解决以下问题。我希望为给定的“一”序列创建一个计数器。例如，我有以下内容: 1 1 1 1 0 0 1 1 1 0 0 1 1 1 1 鉴于该序列，我希望为 1 的每个序列设置一个计数器直到
数字序列的 SAS 计数器
我正在努力解决以下问题。我希望为给定的“一”序列创建一个计数器。例如，我有以下内容: 1 1 1 1 0 0 1 1 1 0 0 1 1 1 1 鉴于该序列，我希望为 1 的每个序列设置一个计数器直到
带小数位的 JavaScript 计数器
我有一个jsfiddle here 这是一个简单的 JavaScript 函数，可以计算出设定的数字。是否可以进行这种计数，但也保留一位小数所以它算 1.1、1.2、1.3 等。 func
具有最大值和最小值的 jQuery 计数器
我正在构建一个计数器，当我按下鼠标时，它应该增加到 maxValue 并且减少不超过 0。我还可以选择将计数器重置为其初始值:0。另外，如果 maxValue 是偶数，它应该计数到该数字。但是，如果
特定标点符号的 C 计数器
所以我成功地为字母和单词构建了其他计数器，但现在我只能用这个来计算句子。我的代码如下，当我运行它时，它会返回很多错误消息: #include #include #include int main
c - C回路，计数器
Closed. This question is off-topic。它当前不接受答案。
具有最近一小时值的 Java 计数器
我需要一个计数器，它会随着某些任务的完成而递增。我们只需要最后一小时的值，即窗口将移动而不是静态时间。解决此问题的最佳方法是什么？我能想到的一种方法是拥有一个大小为 60 的数组，每分钟一个，并更新
PHP 计数器，用于从按钮获取唯一引用
我希望使用计数器来为我提供独特的引用系统。我想单击一个按钮，然后检查一个字段/文件中的最后一个数字，然后简单地向其添加 1，然后将其插入到屏幕上的字段中？不确定执行此操作的最佳方法或具体如何执行此操
PHP 类似表格内的按钮(计数器)
我有一个用 php 制作的表格，在该表格内我显示了数据库中的一些内容。我在每个 td 中创建了一个简单的按钮(类似于 Like)，我希望每次点击它都会增加 1。这是带有按钮的行: echo "
c# - if (计数器==<数据库值>)
如何将数据库中的值转换为可用于 if else 函数的 int 值？例如:在我的数据库“armnumber = 3”中，如何在 if else 函数中使用它？代码 string myConnect
针对特定情况的 MySQL 计数器
我需要生成唯一的“ids”，问题是，它只能在 1 - 99999 之间。 “好”的是，它仅在与另一列组合时必须是唯一的。我们有组，每个组都有自己的“group_id”，每个组都需要类似 unique
Mysql计数器字段。计数器 + 1
有这个简单的代码: UPDATE counter SET c= c +1 where id = 1; 并且它在开头的 c 字段中为 null 的情况下不起作用。它只有在已经输入了一些数字时才有效，也就
带闭包的 python 计数器
我正在尝试在 python 中构建一个具有闭包属性的计数器。以下工作中的代码: def generate_counter(): CNT = [0] def add_one():
用文字写出的 CSS 计数器
我使用 CSS 来计算 HTML 文档中的部分: body {counter-reset: sect;} section:before { counter-increment: sect;

首页

博学

6Ren·AI

商城

mysql - 如何建模数据库以处理多个时区的计数器