MySQL 堆栈过程性能修复，SELECT-6ren

MySQL 堆栈过程性能修复，SELECT

转载作者：行者123 更新时间：2023-11-29 17:22:17

25

4

我需要运行 MYSQL 过程，该过程将从表 pointValues 中选择单个点的时间序列记录。当然，记录数量可能会很大 - 所以我只需要选择其中 200(限制)来绘制图表。我决定根据以下逻辑划分所有记录:

a) 记录/(limit/2) -> 每组中的行数
b) 从 a) 中定义的每个组中获取最小值和最大值。

我在高性能查询方面没有太多经验，因此我需要一些帮助来提高此过程的性能。

CREATE TABLE secChart 
(
     id int(11) NOT NULL,
     dataPointId int(11) NOT NULL,
     dataType int(11),
     pointValue DOUBLE NOT NULL,
     ts bigint(20) NOT NULL 
) ENGINE=InnoDB;

DROP PROCEDURE dataChart;
DROP PROCEDURE IF EXISTS dataChart;

DELIMITER //

CREATE PROCEDURE dataChart(iter int, step int, pointId int, setStart int,

setStop int) 开始截断表 secChart；

    SET @i = 0;
    SET @iter = iter;
    SET @pointId = pointId; myLoop: 

    WHILE (@i < @iter) 
    DO 
         IF @i = 0 THEN
            SET setStart = 0;
            SET setStop = step-1; 
         END IF; 

         IF @i > 0 THEN
            SET setStart = @i * step;
            SET setStop = setStart + (step-1);
            SET @start = setStart;
            SET @stop = setStop; 
         END IF; **

         INSERT INTO secChart
             (SELECT *
              FROM pointvalues
              WHERE dataPointId = @pointId
                AND (pointValue = (SELECT MIN(pointValue)
                                   FROM 
                                       (SELECT *
                                        FROM flex2.pointvalues
                                        WHERE dataPointId = @pointId
                                        ORDER BY id ASC
                                        LIMIT setStart, setStop) AS b)
                     OR pointValue = (SELECT MAX(pointValue)
                                      FROM
                                          (SELECT *
                                           FROM flex2.pointvalues
                                           WHERE dataPointId = @pointId
                                           ORDER BY id ASC
                                           LIMIT setStart, setStop) AS b2))
             ORDER BY id
             LIMIT 0, 2);**

     SET @i = @i + 1; 

     IF @i > @iter 
     THEN 
         LEAVE myLoop; 
     END IF; 
END WHILE; 
END//
DELIMITER ;

CALL dataChart(100, 80, 1, 0, 0);

对于近 15,000 条记录，需要 158 秒...

我测试的另一个选择:

INSERT INTO idx
VALUES(@start, @stop , @i, step);

INSERT INTO stt
    (SELECT * 
     FROM
         ((SELECT * 
           FROM
               (SELECT id, pointValue, ts
                FROM flex2.pointvalues AS pv
                WHERE pv.dataPointId = 1
                ORDER BY id
                LIMIT setStart, setStop) AS minval
           ORDER BY pointValue DESC
           LIMIT 0, 1)
          UNION
           (SELECT *  
            FROM
                (SELECT id, pointValue, ts
                 FROM flex2.pointvalues AS pv
                 WHERE pv.dataPointId = 1
                 ORDER BY id
                 LIMIT setStart, setStop) AS maxval
            ORDER BY pointValue ASC
            LIMIT 0, 1)) AS selectScore);

对于近 15,000 条记录，需要 58 秒 - 更快，但还不够快。

第三个想法是选择 n 行(例如 12 000 行中的 200 行)

SELECT COUNT(*) 
FROM flex2.pointvalues 
WHERE dataPointId = 1 
  AND id IN (SELECT id 
             FROM flex2.pointvalues 
             WHERE dataPointId = 1 
               AND id BETWEEN 
                           (SELECT MIN(id) FROM flex2.pointvalues 
                            WHERE dataPointId = 1) AND 
                           (SELECT MAX(id) FROM flex2.pointvalues 
                            WHERE dataPointId = 1)) 
              AND id % 10 = 0;

最好是修复想法 2 的性能。请帮忙!

最佳答案

首先是一些问题和评论。

您想从时间序列数据集中选取均匀间隔的点吗？
您正在绘制“烛台”(因此是最小值和最大值)吗？
不要使用任何类型的循环；会很慢。
目标是通过单个SELECT(无循环)来获取所有所需的项目。 SQL 已针对此进行了优化。
为什么表中有 5 列而不是简单的 2 列(代表 x 和 y，又名 ts 和值)？
您希望图表基于时间还是基于表中的索引？将会存在数据缺失的情况，因此您将会希望将图表基于时间。
避免OFFSET(即LIMIT m,n)，它必须扫描所有前面的行；因此很慢。

让我们退后一步。让我们首先考虑使用 AVG 而不是 MIN 和 MAX 的方法，而不是获取烛台。一旦掌握了这一点，也许就可以制作烛台了。

SELECT FLOOR(ts / 300000) AS '5-minute-intervals',  -- see below
       AVG(value)
    FROM tbl
    WHERE ts ...   -- limit the time span
    GROUP BY 1     -- shorthand, referring to the FLOOR(..)

300000 假定为毫秒 ts(Java 语言)。您根据时间跨度和“200...”讨论预先计算了该数字。

这就是全部内容。

现在，对于烛台:

SELECT FLOOR(ts / 300000) AS '5-minute-intervals',
       MIN(value),
       MAX(value)
    FROM tbl
    WHERE ts ...   -- limit the time span
    GROUP BY 1     -- shorthand, referring to the FLOOR(..)

然后你的图表程序需要获取最小值和最大值，并以某种方式将其变成一条垂直线。如果您确实想要某些百分位数而不是最小值和最大值，那就会变得非常困惑。

获取间隔...

请使用人类可读的时间。我真的不喜欢从数据导出但未能使用“圆形”数字的 x 轴和 y 轴。 (例如，当目标是大约 10 次抽动时，他们使用 143、286、...、1432，而不是 100、200、...、1500，但他们认为这意味着恰好 10抽搐。)

要“正确”地做到这一点，需要找到总体最大值和最小值，并进行一些涉及floor()和/或ceil()的算术运算。并投入一些启发式方法以获得“整数”。这可能是另一个讨论。它是纯粹的算法——可以用您的编程语言或 SQL 来同样好地实现。

关于MySQL 堆栈过程性能修复，SELECT，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51187754/

25

4

0

文章推荐： mysql - docker-compose.yml问题nodejs和mysql

文章推荐： android - 超薄库不支持带有多个 TextView 的标题

文章推荐： android - 如何在 Activity 中传递 onActivityResult 数据？

javascript - 修复 IE 的 div 宽度 @media 修复
我将一个 div 设置为 100% 宽度，当以 1024 分辨率查看页面时，宽度应从 100% 变为 1000px，我让它与@media 查询一起正常工作，并且在 FF、safari chrome 上
ckeditor - Domino 9.01 修复 3 CKEditor 错误 - 9.01 修复 1 上没有错误
希望有人能帮助我，我已经被困了几天了。将我的 Domino 服务器更新到 9.01 Fix 3 后，我在 javascript 控制台上不断收到错误消息: TypeError: this.edito
Java内存使用/修复
我们正在使用一个基于RMI的java应用程序。当我们运行应用程序时，即使应用程序处于理想阶段，内存使用量仍然不断增加。我们主要使用Vector和散列图数据结构。如何最大限度地减少java内存使用/修复
修复 IDM下载器假序列号错误优秀技巧分享
概述 Internet Download Manager (IDM)是最流行的 Windows 下载管理器。如果你平时工作中使用过IDM,您会惊叹 IDM 下载文件的速度有多快。IDM
authorization - 打开勇敢的浏览器时弹出错误？修复？
当我打开 brave 浏览器时，会打开一个窗口(如下所示)。它并没有真正干扰浏览器的处理。但令人担忧的是为什么这种情况一直发生...... Error On Opening Brave Browser
for-loop - 修复 For 循环中的错误
这是我今天在求职面试中被问到的一个问题: 看下面的代码: int n=20; for (int i =0; i
macports 修复/替换命令？
我不小心删除了/opt/local/bin/perl5.8.9 ，这似乎是 macports 编译的 perl 的主要二进制文件。现在我有很多取决于 perl5 的端口，但不想卸载并重新安装所有端口
haskell - 翻转修复/修复
>>>flip fix (0 :: Int) (\a b -> putStrLn "abc") Output: "abc" 这是使用翻转修复的简化版本。我在一些 YouTube 视频中看到了这种使用
java - 修复 NetworkOnMainThreadException
这个问题已经有答案了: How can I fix 'android.os.NetworkOnMainThreadException'? (64 个回答) 已关闭 3 年前。我在 Android 应
python - 修复 UnboundLocalError
def main(): cash = float(input("How much money: ")) coins = 0 def changeCounter(n): whil
mysql - 查询优化/修复
前一周我遇到了类似的问题，查询需要永远运行。在编写此查询时，我尝试应用从其他查询中学到的一些知识，但执行起来需要很长时间。运行查询的两个单独部分时，每个部分需要 2 分钟才能完成，这是可以接受的，但
CSS 'Dropdown' 修复
下午，我的 CSS 有问题。第三个下拉菜单放错了，我没有解决办法。这是我想要的: 之前: http://i53.tinypic.com/2qu85z8.png 之后: http://i51.tiny
ios - NSInternalInconsistencyException 修复
更新方法: override func tableView(_ tableView: UITableView, commit editingStyle: UITableViewCellEditingS
导航栏折叠的 CSS 修复
我知道这是一个很多人都遇到过的问题，但我不熟悉 Less 并且是 Bootstrap 的新手，我正在寻找一种全 CSS 解决方案来防止我的导航栏折叠到 768 像素以下:
javascript - 可调整大小的粘性页脚与内容重叠 - 修复
在我的布局中，我创建了以下 jsfiddle 托管的可调整大小的粘性页脚。但是，在调整大小时它与内容重叠。有没有办法让它在所有浏览器上都能响应？ http://jsfiddle.net/9aLc0mg
javascript - 修复 if 语句以停止移动
我想要实现的目标 racer-offset 是为了让用户可以设置图像可以以 px 为单位移动多远。偏移量管理偏移量。 Speed-racer 告诉我们图像在滚动过程中移动的速度。我的问题是它不会停止。
c++ - 修复/改进自动换行功能
我有一个简单的自动换行函数，它接受一个长字符串作为输入，然后将该字符串分成更小的字符串，并将它们添加到一个数组中，以便稍后输出。现在最后一两个字没有输出。这是主要问题。但是，我还想改进功能。我知道这有
禁用按钮的 JQuery 修复
我试图在使用每个 slider 之前禁用“下一步”按钮，我不确定为什么在单击不再是 class="not-clicked"的同一个 slider 时取消禁用该按钮. JSFiddle: (这里看起来有
java - 修复 NullPointerException？
这个问题已经有答案了: What is a NullPointerException, and how do I fix it? (12 个回答) 已关闭 8 年前。如何让程序输出所有信息？ IT
菜单鼠标悬停的 CSS 修复
On this page ，在“生活”下有一个带有自动生成的子菜单的菜单。子菜单存在一些问题(它会闪烁并改变大小——如果你滚动它就会看到)。我需要以某种方式覆盖它当前正在读取的 css 并使其统一。

首页

博学

6Ren·AI

商城

MySQL 堆栈过程性能修复，SELECT