mysql - 如何查找上一条记录[n-per-group max(timestamp)

mysql - 如何查找上一条记录[n-per-group max(timestamp) < timestamp]？

转载作者：行者123 更新时间：2023-11-29 12:52:59

26

4

我有一个包含时间序列传感器数据的大表。大型是指分布在被监控的各个 channel 中的从几千到 10M 的记录。对于某种传感器类型，我需要计算当前读数和上一个读数之间的时间间隔，即找到当前读数之前的最大时间戳。

我想到了显而易见的方法，每种方法都在 Core i5 上针对 40k 条目的 channel 进行了测量:

相关子查询

SELECT collect.*, prev.timestamp AS prev_timestamp
FROM data AS collect 
LEFT JOIN data AS prev ON prev.channel_id = collect.channel_id AND prev.timestamp = ( 
    SELECT MAX(timestamp) 
    FROM data 
    WHERE data.channel_id = collect.channel_id AND data.timestamp < collect.timestamp
) 
WHERE collect.channel_id=14 AND collect.timestamp >= 0 
ORDER BY collect.timestamp

时间(执行、获取)11秒、21秒

计划

+----+--------------------+---------+------+------------------------------+---------+---------+-------------------------+-------+--------------------------+
| id |    select_type     |  table  | type |        possible_keys         |   key   | key_len |           ref           | rows  |          Extra           |
+----+--------------------+---------+------+------------------------------+---------+---------+-------------------------+-------+--------------------------+
|  1 | PRIMARY            | collect | ref  | ts_uniq,IDX_ADF3F36372F5A1AA | ts_uniq |       5 | const                   | 45820 | Using where              |
|  1 | PRIMARY            | prev    | ref  | ts_uniq,IDX_ADF3F36372F5A1AA | ts_uniq |      13 | const,func              |     1 | Using index              |
|  2 | DEPENDENT SUBQUERY | data    | ref  | ts_uniq,IDX_ADF3F36372F5A1AA | ts_uniq |       5 | nils.collect.channel_id |  2495 | Using where; Using index |
+----+--------------------+---------+------+------------------------------+---------+---------+-------------------------+-------+--------------------------+

反加入

SELECT d1.*, d2.timestamp AS prev_timestamp
FROM data d1
LEFT JOIN data d2 ON
    d2.channel_id=14 AND
    d2.timestamp < d1.timestamp 
LEFT JOIN data d3 ON
    d3.channel_id=14 AND
    d3.timestamp < d1.timestamp AND
    d3.timestamp > d2.timestamp
WHERE 
    d3.timestamp IS NULL AND
    d1.channel_id=14
ORDER BY timestamp

时间 12秒，21秒

计划

+----+-------------+-------+------+------------------------------+---------+---------+-------+-------+--------------------------------------+
| id | select_type | table | type |        possible_keys         |   key   | key_len |  ref  | rows  |                Extra                 |
+----+-------------+-------+------+------------------------------+---------+---------+-------+-------+--------------------------------------+
|  1 | SIMPLE      | d1    | ref  | ts_uniq,IDX_ADF3F36372F5A1AA | ts_uniq |       5 | const | 45820 | Using where                          |
|  1 | SIMPLE      | d2    | ref  | ts_uniq,IDX_ADF3F36372F5A1AA | ts_uniq |       5 | const | 47194 | Using index                          |
|  1 | SIMPLE      | d3    | ref  | ts_uniq,IDX_ADF3F36372F5A1AA | ts_uniq |       5 | const | 47194 | Using where; Using index; Not exists |
+----+-------------+-------+------+------------------------------+---------+---------+-------+-------+--------------------------------------+

我想出了另一种模式，我称之为朴素计数

SELECT current.*, prev.timestamp AS prev_timestamp FROM
(
    SELECT data.*, @r1 := @r1+1 AS rownum from data
    CROSS JOIN (SELECT @r1 := 0) AS vars 
    WHERE channel_id=14
    ORDER BY timestamp
) AS current
LEFT JOIN
(
    SELECT data.*, @r2 := @r2+1 AS rownum from data
    CROSS JOIN (SELECT @r2 := 0) AS vars 
    WHERE channel_id=14
    ORDER BY timestamp
) AS prev
ON current.rownum = prev.rownum+1

时间 1.1秒(这实际上是最快的!)

计划

+----+-------------+------------+--------+------------------------------+---------+---------+-----+-------+----------------+
| id | select_type |   table    |  type  |        possible_keys         |   key   | key_len | ref | rows  |     Extra      |
+----+-------------+------------+--------+------------------------------+---------+---------+-----+-------+----------------+
|  1 | PRIMARY     | <derived2> | ALL    |                              |         |         |     | 24475 |                |
|  1 | PRIMARY     | <derived4> | ALL    |                              |         |         |     | 24475 |                |
|  4 | DERIVED     | <derived5> | system |                              |         |         |     |     1 |                |
|  4 | DERIVED     | data       | ref    | ts_uniq,IDX_ADF3F36372F5A1AA | ts_uniq |       5 |     | 45820 | Using where    |
|  5 | DERIVED     |            |        |                              |         |         |     |       | No tables used |
|  2 | DERIVED     | <derived3> | system |                              |         |         |     |     1 |                |
|  2 | DERIVED     | data       | ref    | ts_uniq,IDX_ADF3F36372F5A1AA | ts_uniq |       5 |     | 45820 | Using where    |
|  3 | DERIVED     |            |        |                              |         |         |     |       | No tables used |
+----+-------------+------------+--------+------------------------------+---------+---------+-----+-------+----------------+

由于查询可能在像 RasPi 这样的小型平台上运行，因此性能至关重要 - 几秒钟是最可接受的。

我的问题:最后一种方法对于每组最优秀的人来说是一个好的方法还是有更好的方法？相关子查询是否像经历的那样慢？

最佳答案

最后一种使用变量的方法是合理的。您也可以尝试:

SELECT collect.*,
       (select max(timestamp)
        from data
        where data.channel_id = collect.channel_id AND data.timestamp < collect.timestamp
       ) AS prev_timestamp
FROM data AS collect 
WHERE collect.channel_id = 14 AND collect.timestamp >= 0 
ORDER BY collect.timestamp;

此外，创建索引:collect(channel_id, timestamp)。

编辑:

以下可能是最快的:

  select d.*,
         if(@channel_id = channel_id, @prev_timestamp, NULL) as prev_timestamp,
         @channel_id := channel_id, @prev_timestamp = timestamp
  from data d cross join
       (select @channel_id := 0, @prev_timestamp := 0) vars
  where collect.channel_id = 14 AND collect.timestamp >= 0 
  order by channel_id, timestamp;

关于mysql - 如何查找上一条记录[n-per-group max(timestamp) < timestamp]？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24457442/

26

4

0

文章推荐： mysql - 获取特定列值的最新条目

文章推荐： node.js - sequelize中如何设置复杂的join条件？

文章推荐： postgresql : read GIN index content

文章推荐： php - if isset($_POST 问题

c# - Lambda Max 和 Max 和 Max
快速且可能简单的 Lambda 问题: 我有一家有评论的餐厅。我想查询具有以下内容的那个: 最大(平均评分) 和 Max(ReviewCount) 和 Max(NewestReviewDate) 和
c++ - 我可以使用折叠表达式实现 max(A, max(B, max(C, D))) 吗？
在尝试使用 C++17 折叠表达式时，我尝试实现 max sizeof ，其中结果是类型 sizeof 的最大值。我有一个使用变量和 lambda 的丑陋折叠版本，但我想不出一种使用折叠表达式和 st
c - 在C中，为什么 "int MAX = 10^6...int arr[MAX]"不会崩溃，但 "int MAX = 1000000...int arr[MAX]"会崩溃？
我目前正在使用 C 并遇到了一些我觉得有趣的东西，但似乎在这里找不到任何类似的东西。我正在为数组(大小 1000000)静态分配内存。我知道这相当大并且有可能引起问题。但是，使用 10^6 不会出现
css - firefox css max-width 和 max-height 内 max-height div
我有一个具有 max-height 的 div 和其中的图像，应该使用 max-width:100% 和 max-height:100%。在 Chromium 中，这是可行的，但 Firefox 仅使
css - firefox css max-width 和 max-height 里面的 max-height div
我有一个最大高度的 div 和里面的一个图像，它应该使用最大宽度:100% 和最大高度:100%。在 Chromium 中，这是可行的，但 Firefox 仅使用最大宽度而忽略最大高度。 div#ov
awk - 解释 awk 命令 `awk ' { if (NF > max) max = NF } END { print max }'
在一本在线 awk 手册中我找到了例子awk '{ if (NF > max) max = NF } END { print max }' 该程序打印任何输入行上的最大字段数。但我不明白 awk 如何
sql - 使用 VARCHAR(max)、NVARCHAR(max) 和 VARBINARY(max) 代替 TEXT、NTEXT 和 IMAGE 有什么好处？
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
mysql - MYSQL 上的 Max of Max
我正在制作一个非循环图数据库。表 Material (id_item，id_collection，...)主键(id_item，id_collection) (item可以是collection本身
MYSQL、Max、Group by 和 Max
我有以下两个表。 1.电影详情(电影ID、电影名称、评分、票数、年份) 2.电影类型(Movie-ID,Genre) 我正在使用以下查询来执行连接并获得每个评分最高的电影流派。 select Movi
MySQL max() - 不返回 max() 值
我有一个查询，我想返回 idevent 中给定传感器 ID (sensorID) 范围内的最高 ID 值，但是查询没有返回最高值。我运行查询时减去 max() 语句的结果: mysql> SELEC
mysql - SUM(MAX( ) + MAX( )) 怎么做？
SUM(MAX() + MAX()) 有正确的方法吗？这是我一直在努力做的事情 SELECT SUM(MAX(account.BALANCE1) + MAX(account.BALANCE2))
css - 多个媒体查询 : max-width or max-height
这个问题类似于CSS media queries: max-width OR max-height , 但由于我的代表不够高，我无法在回复中添加评论(问题)，我想在原始问题中添加。与其他主题中的发帖
.net - Math.Max 与 Enumerable.Max
Jon Skeet今天报告(source): Math.Max(1f, float.NaN) == NaN new[] { 1f, float.NaN }.Max() == 1f 为什么？编辑:双倍
java - Stream.max(Integer::max) :意外结果
这个问题已经有答案了: Java 8 stream's .min() and .max(): why does this compile? (5 个回答) 已关闭 7 年前。我正在学习1z0-809
mysql - 以准确的 MAX 顺序在特定时间戳之间获取具有 MAX 值的记录
我在处理一些数据库记录时遇到了一些挑战。我需要为特定列获取具有 MAX 值的行，并且这些记录必须介于两个时间戳值之间。这是SQL查询 SELECT id, MAX(amount), created
CSS 媒体查询 : max-width And max-height
我想在媒体查询中使用 AND 条件。我使用了下面的代码，但是没有用 @media screen and (max-width: 995px AND max-height: 700px) { } 最佳答
CSS 媒体查询 : max-width OR max-height
在编写 CSS 媒体查询时，有什么方法可以用“或”逻辑指定多个条件吗？我正在尝试做这样的事情: /* This doesn't work */ @media screen and (max-widt
python - max 和 np.max 的区别
我对仅使用 max(list array) 和 np.max(list array) 之间的区别有疑问。这里唯一的区别是 Python 返回代码所需的时间吗？最佳答案它们在边缘情况下可能不同，例
python 为什么 max(max(float_2d_array)) 给出错误的答案？
例如: a = [[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0], [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.
java - Stream.max(Integer::max) :意外结果
这个问题在这里已经有了答案: Java 8 stream's .min() and .max(): why does this compile? (5 个答案) 关闭 6 年前。我正在学习 1z0

首页

博学

6Ren·AI

商城

mysql - 如何查找上一条记录[n-per-group max(timestamp) < timestamp]？