PostgreSQL:如何按 'nearby' 时间戳对行进行分组-6ren

PostgreSQL:如何按 'nearby' 时间戳对行进行分组

转载作者：行者123 更新时间：2023-11-29 12:17:04

27

4

考虑以下简化情况:

create table trans
(
  id integer not null
, tm timestamp without time zone not null
, val integer not null
, cus_id integer not null
);

insert into trans 
  (id, tm, val, cus_id)
values
  (1, '2017-12-12 16:42:00', 2, 500) --
 ,(2, '2017-12-12 16:42:02', 4, 501) -- <--+---------+
 ,(3, '2017-12-12 16:42:05', 7, 502) --    |dt=54s   |
 ,(4, '2017-12-12 16:42:56', 3, 501) -- <--+         |dt=59s
 ,(5, '2017-12-12 16:43:00', 2, 503) --              |
 ,(6, '2017-12-12 16:43:01', 5, 501) -- <------------+
 ,(7, '2017-12-12 16:43:15', 6, 502) --
 ,(8, '2017-12-12 16:44:50', 4, 501) --
;

我想按 cus_id 对行进行分组，而且同一 cus_id 的连续行的时间戳之间的间隔小于 1 分钟。

在上面的示例中，这适用于 ID 为 2、4 和 6 的行。这些行具有相同的 cus_id (501) 并且间隔小于 1 分钟。间隔 id{2,4} 是 54s，id{2,6} 是 59s。间隔 ID {4,6} 也低于 1 分钟，但它被更大的间隔 ID {2,6} 覆盖。

我需要一个能给我输出的查询:

 cus_id |         tm          | val 
--------+---------------------+-----
    501 | 2017-12-12 16:42:02 |  12
(1 row)

tm 值将是第一行的 tm，即具有最低的 tm。 val 将是分组行的总和 (val)。

在示例中，3 行被分组，但也可以是 2、4、5，...为简单起见，我只让 cus_id 501 的行具有附近的时间戳，但在我的真实表中，它们会更多。它包含超过 2000 万行。

这可能吗？

最佳答案

使用 CTE 的原始(次优)解决方案(更快的方法会避免 CTE，用连接的子查询代替它，甚至可能使用窗口函数):

        -- Step one: find the start of a cluster
        -- (the start is everything after a 60 second silence)
WITH starters AS (
        SELECT * FROM trans tr
        WHERE NOT EXISTS (
                SELECT * FROM trans nx
                WHERE nx.cus_id = tr.cus_id
                AND nx.tm < tr.tm
                AND nx.tm >= tr.tm -'60sec'::interval
                )
        )
                -- SELECT * FROM starters ; \q
        -- Step two: join everything within 60sec to the starter
        -- and aggregate the clusters
SELECT st.cus_id
        , st.id AS id
        , MAX(tr.id) AS max_id
        , MIN(tr.tm) AS first_tm
        , MAX(tr.tm) AS last_tm
        , SUM(tr.val) AS val
FROM trans tr
JOIN starters st ON st.cus_id = tr.cus_id
        AND st.tm <= tr.tm AND st.tm > tr.tm -'60sec'::interval
GROUP BY 1,2
ORDER BY 1,2
    ;

关于PostgreSQL:如何按 'nearby' 时间戳对行进行分组，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47777206/

27

4

0

文章推荐： python - sqlacodegen 不生成任何表

文章推荐： ios - 从主线程的 Assets 目录加载图像？

文章推荐： postgresql - Postgres : SELECT blocks INSERT for an unrelated table

文章推荐： ios - UITextField 上的圆角边缘

正则表达式在存在多个时提取第一个 date_time 戳
给定一个带有多个 date_time 戳的字符串，我想提取第一个戳及其前面的文本候选字符串可以有一个或多个时间戳后续的 date_time 戳记将被 sep="-" 隔开后续date_time
android - 照片上的文字(日期)戳
是否可以合并从相机拍摄的文本和照片？我想在照片上标记日期和时间，但我在 Google 上找不到任何内容。最佳答案使用下面的代码来实现你所需要的。 Bitmap src = Bitm
facebook - 有没有办法通过 Graph API 戳？
有没有办法通过 Graph API 戳另一个用户？基于this post ，并使用 Graph Explorer ，我发布到“/USERID/pokes”，我已经授予它(Graph API 应用程序和
html - Firefox float 元素需要 DOM 戳
我有两个向左浮动的元素。一个是 body 的第一个 child ，另一个是容器的第一个 child ，容器是 body 的第二个 child 。 ...

首页

博学

6Ren·AI

商城

PostgreSQL:如何按 'nearby' 时间戳对行进行分组