postgresql - 将时间差较小的交错记录分组-6ren

postgresql - 将时间差较小的交错记录分组

转载作者：行者123 更新时间：2023-11-29 13:09:05

24

4

这个问题很难回答，但我正在尝试复制社交媒体或通知提要在批量最近事件时所做的事情，以便它们可以显示操作的“序列”。例如，如果这些是“类似”记录，按时间倒序排列:

like_id | user_id |   like_timestamp
--------------------------------
1       | bob     | 12:30:00
2       | bob     | 12:29:00
3       | jane    | 12:27:00
4       | bob     | 12:26:00
5       | jane    | 12:24:00
6       | jane    | 12:23:00
7       | scott   | 12:22:00
8       | bob     | 12:20:00
9       | alice   | 12:19:00
10      | scott   | 12:18:00

我想对它们进行分组，以便获得用户喜欢的最后 3 个“突发”，按用户分组(分区？)。如果“连发”规则是相隔小于 5 分钟的点赞属于同一个连发，那么我们会得到:

user_id | num_likes | burst_start | burst_end
----------------------------------------------
bob     | 3         | 12:26:00    | 12:30:00
jane    | 3         | 12:23:00    | 12:27:00
scott   | 2         | 12:18:00    | 12:22:00

alice 的点赞没有被计算在内，因为它是第 4 个最近批处理的一部分，而点赞 8 没有被添加到 bob 的计数中，因为它是下一个之前 6 分钟。

我已经尝试使用 postgres 的 lag 函数来跟踪突发事件，它可以让我标记开始和结束事件，但是由于类似事件可以错开，所以我无法将类似事件联系起来到它的“发起者”(例如，将 id 4 绑定(bind)回 2)。

这样分组可行吗？如果是这样，是否可以跟踪每个突发的开始和结束时间戳？

最佳答案

step-by-step demo:db<>fiddle

WITH group_ids AS (   -- 1
    SELECT DISTINCT
        user_id,
        first_value(like_id) OVER (PARTITION BY user_id ORDER BY like_id) AS group_id
    FROM
        likes
    LIMIT 3
)
SELECT 
    user_id,
    COUNT(*) AS num_likes,
    burst_start,
    burst_end
FROM (
    SELECT
        user_id,
        -- 4
        first_value(like_timestamp) OVER (PARTITION BY group_id ORDER BY like_id) AS burst_end,
        first_value(like_timestamp) OVER (PARTITION BY group_id ORDER BY like_id DESC) AS burst_start
    FROM (
        SELECT
            l.*, gi.group_id,
            -- 2
            lag(like_timestamp) OVER (PARTITION BY group_id ORDER BY like_id) - like_timestamp AS diff
        FROM
            likes l 
        JOIN
            group_ids gi ON l.user_id = gi.user_id
    ) s
    WHERE diff IS NULL OR diff <= '00:05:00'  -- 3
) s
GROUP BY user_id, burst_start, burst_end  -- 5

CTE 用于为每个 user_id 创建一个有序的组 ID。因此，第一个用户(这里是最近的用户)获得最低的 group_id(即 bob)。第二个用户第二高(jane)等等。这用于能够在一个分区内与某个用户的所有喜欢一起工作。这一步是必要的，因为您不能简单地按 user_id 排序，这会使 alice 到达顶部。 LIMIT 3 将整个查询限制为前三个用户。
加入计算出的用户的group_id 后，使用lag() window function 计算时间差。这使您可以获得以前的值。所以它可以用来轻松计算当前时间戳与前一个时间戳之间的差异。这仅发生在用户组内。
之后，可以通过计算的 diff
然后可以使用first_value() 窗口函数(升序和降序)计算最高和最低时间戳。这些标记您的 burst_start 和 burst_end
最后，您可以对所有用户进行分组并计算他们的记录。

关于postgresql - 将时间差较小的交错记录分组，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57156260/

24

4

0

文章推荐： iOS提取子字符串的最快方法

文章推荐： mysql - CakePHP错误: SQLSTATE[42S02] table not found - but exist

文章推荐： ios - UITableView 还是 Collection View ？

c - 时间差(以微秒为单位)
我对 EPOCH 时间有疑问。我需要计算两个数据包之间的时间差。我不太确定如何: printf("Epoch Time: %d:%d seconds\n", header->ts.tv_sec, h
两个值之间的 C++ 时间差
我正在尝试了解数字旋转的速度。我有一个程序，其中计数器从 0 开始。每次用户单击按钮“加 1”。它将计数器递增 1。计数器最大值为 255。在 255 之后它回到 0。现在我想显示从 0 到递增
表中所选记录的一列上的 MySQL 时间差
基本上我想做的是根据 SIP 信令获取通话持续时间。我有一个包含如下所示记录的表，我正在尝试编写一个返回以下内容的 SELECT 语句: id callid date
匹配条件的行之间的 MySQL 时间差
您好，我需要有关 MySQL 数据库查询的帮助。我有一个看起来像这样的表: ID TRACKID DATE Name Action 38
datetime - 我需要计算一个日期时间列之间的日期/时间差
细节。我有包含以下列的注释表。 ID - INT(3) Date - DateTime Note - VARCHAR(100) Tile - Varchar(100
java - 时间差 - 从午夜之前到午夜之后，无日期
午夜过后我很难计算时间: String time = "15:00-18:05"; //Calculating OK //String time = "22:00-01:05"; //Not
javascript - 如何使用给定的日期/时间在javascript中获取日期/时间差
我使用 XML 从 MySQL 数据库中抓取了两个日期，如下所示。我想获得以秒为单位的时差。我写了这个脚本，但它给出了“NaN” function show(){ var t1 = new Dat
php - MYSQL PHP 时间差
如何在 MYSQL phpMyAdmin 数据库中以 (TIME 00:00:00) 格式更新另一个字段(整列)的时间差当我在 PHP 中执行此操作时，我不断收到 0:00:00 并且没有结果。其
javascript - 来自两个字段的 Jquery 时间差(以小时为单位)
我的表单中有两个字段，用户可以在其中选择输入时间(开始时间、结束时间)，我想在更改这些字段时重新计算另一个字段的值。我想做的是获取 2 次之间的小时数。因此，例如，如果我的开始时间为 5:30，结束
java - 考虑 AM/PM 计算 Java 中的日期/时间差
我想使用 Date 和 Calendar 类计算 java 中两个日期/时间之间的差异。我的格式是“2012-01-24 12:30:00 PM”。我已经实现了我自己的方法，也用谷歌搜索它以与其他人
mysql - 从具有时间戳和访客 ID 的 SQL 表生成访客 InTime 访客 OutTime 和访问持续时间(时间差)的 SQL 查询
MySQL 服务器上的访客数据库如下所示id 是主键整数类型，firstname 和 lastname 是文本类型，访客 id 是整数类型 id firstname lastname

首页

博学

6Ren·AI

商城

postgresql - 将时间差较小的交错记录分组