MySQL 独特的性能-6ren

MySQL 独特的性能

转载作者：行者123 更新时间：2023-12-02 03:18:02

当我向查询中添加“distinct”时，查询时间从 0.015 秒增加到超过 6 秒。

我想连接多个表，这些表通过外键链接并从中获取不同的列:

select distinct table3.idtable3 from 
    table1
    join table2 on table1.idtable1 = table2.fkey
    join table3 on table2.idtable2 = table3.fkey
    where table1.idtable1 = 1

不同的查询需要 6 秒，在我看来这是可以改进的。

选择:

持续时间:0.015s/获取:5.532s(5.760.434 行)

解释:

id, select_type, table, partitions, type, possible_keys, key, key_len, ref, rows, filtered, Extra
1   SIMPLE  table1      index   asd asd 137     10  10.00   Using where; Using index
1   SIMPLE  table2      ALL idtable2                200 25.00   Using where; Using join buffer (Block Nested Loop)
1   SIMPLE  table3      ref fkey_table2_table_3_idx fkey_table2_table_3_idx 138 mydb.table2.idtable2    66641   100.00

<小时/>

具有不同的选择:

持续时间:6.625s/获取:0.000s(1000 行)

解释:

id, select_type, table, partitions, type, possible_keys, key, key_len, ref, rows, filtered, Extra
1   SIMPLE  table1      index   asd asd 137     10  10.00   Using where; Using index; Using temporary
1   SIMPLE  table2      ALL idtable2                200 25.00   Using where; Using join buffer (Block Nested Loop)
1   SIMPLE  table3      ref fkey_table2_table_3_idx fkey_table2_table_3_idx 138 mydb.table2.idtable2    66641   100.00

数据库: Database snippet

测试代码/MCRE:

import mysql.connector
import time
import numpy as np




""" 
-- MySQL Script generated by MySQL Workbench
-- Fri Jan 17 12:19:26 2020
-- Model: New Model    Version: 1.0
-- MySQL Workbench Forward Engineering

SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0;
SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0;
SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION';

-- -----------------------------------------------------
-- Schema mydb
-- -----------------------------------------------------

-- -----------------------------------------------------
-- Schema mydb
-- -----------------------------------------------------
CREATE SCHEMA IF NOT EXISTS `mydb` DEFAULT CHARACTER SET utf8 ;
USE `mydb` ;

-- -----------------------------------------------------
-- Table `mydb`.`table1`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `mydb`.`table1` (
  `idtable1` VARCHAR(45) NOT NULL,
  INDEX `asd` (`idtable1` ASC) VISIBLE)
ENGINE = InnoDB;


-- -----------------------------------------------------
-- Table `mydb`.`table2`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `mydb`.`table2` (
  `idtable2` VARCHAR(45) NOT NULL,
  `fkey` VARCHAR(45) NULL,
  INDEX `link_table1_table2_idx` (`fkey` ASC) INVISIBLE,
  INDEX `idtable2` (`idtable2` ASC) VISIBLE,
  CONSTRAINT `link_table1_table2`
    FOREIGN KEY (`fkey`)
    REFERENCES `mydb`.`table1` (`idtable1`)
    ON DELETE NO ACTION
    ON UPDATE NO ACTION)
ENGINE = InnoDB;


-- -----------------------------------------------------
-- Table `mydb`.`table3`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `mydb`.`table3` (
  `idtable3` VARCHAR(45) NOT NULL,
  `fkey` VARCHAR(45) NULL,
  INDEX `fkey_table2_table_3_idx` (`fkey` ASC) VISIBLE,
  CONSTRAINT `fkey_table2_table_3`
    FOREIGN KEY (`fkey`)
    REFERENCES `mydb`.`table2` (`idtable2`)
    ON DELETE NO ACTION
    ON UPDATE NO ACTION)
ENGINE = InnoDB;


SET SQL_MODE=@OLD_SQL_MODE;
SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS;
SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS;


"""


def insertData():
    for i in range(2):
        num_distinct_table1_values = 5
        num_distinct_table2_values = 10
        num_distinct_table3_values = 1000

        num_entries_table1 = int(num_distinct_table1_values)
        num_entries_table2 = int(num_distinct_table2_values * 10)
        num_entries_table3 = int(num_distinct_table3_values * 300)

        random_numbers_table1_id = range(num_distinct_table1_values)

        random_numbers_table2_id = np.random.randint(num_distinct_table2_values, size=int(num_entries_table2))
        random_numbers_table2_fkey = np.random.randint(num_distinct_table1_values, size=int(num_entries_table2))

        random_numbers_table3_id = np.random.randint(num_distinct_table3_values, size=int(num_entries_table3))
        random_numbers_table3_fkey = np.random.randint(num_distinct_table2_values, size=int(num_entries_table3))

        value_string_table1 = ','.join([f"('{i_name}')" for i_name in random_numbers_table1_id])
        value_string_table2=""
        for i in range(num_entries_table2):
            value_string_table2 = value_string_table2+','.join(
                ["('{id}','{fkey}'),".format(id=random_numbers_table2_id[i], fkey=random_numbers_table2_fkey[i])])

        value_string_table3=""
        for i in range(num_entries_table3):
            value_string_table3 = value_string_table3+','.join(
                ["('{id}','{fkey}'),".format(id=random_numbers_table3_id[i], fkey=random_numbers_table3_fkey[i])])

        # fill table 1
        mySql_insert_query = f"INSERT INTO table1 (idtable1) VALUES {value_string_table1}"
        cursor.execute(mySql_insert_query)
        conn.commit()
        print("Done table 1")
        # fill table 2
        mySql_insert_query = f"INSERT INTO table2 (idtable2, fkey) VALUES {value_string_table2}"
        mySql_insert_query=mySql_insert_query[0:-1]
        cursor.execute(mySql_insert_query)
        print("Done table 2")
        # fill table 3
        mySql_insert_query = f"INSERT INTO table3 (idtable3, fkey) VALUES {value_string_table3}"
        mySql_insert_query = mySql_insert_query[0:- 1]
        cursor.execute(mySql_insert_query)
        print("Done table 3")

        conn.commit()

conn = mysql.connector.connect(user='root', password='admin', host='127.0.0.1',
                               database='mydb', raise_on_warnings=True, autocommit=False)
cursor = conn.cursor()


insertData()


conn.close()

最佳答案

感谢创建表；没有他们，您可能永远不会得到答案。

每个表都应该有一个主键。如果您有一个“自然”有效的列(或列组合)，请使用它。否则使用 AUTO_INCRMENT。
计时查询时，(1) 确保未使用“查询缓存”，(2) 运行查询两次以检查计时的其他变化。
INDEX(fkey) 是 INVISIBLE，因此未使用。不要在 VISIBLE/INVISIBLE 上浪费学习时间，您的职业生涯中可能永远不需要它们。
在进行试验时，请确保每个表中包含多于几行，并且它们的值以实际的方式变化。否则，优化器可能会走捷径，这只会让您的学习体验变得困惑。

还有...

duration : 0.015s / fetch:5.532s (5.760.434 rows)
duration : 6.625s / fetch:0.000s (1000 rows)

请注意两者都大约为 6 秒。只是时间划分不同而已。

如果有 600 万行且没有 DISTINCT，查询可以立即提取数据，但由于网络延迟而需要很长时间。
使用DISTINCT，只有在执行“重复数据删除”之后才能显示第一行，这可能涉及“临时”(请参阅EXPLAIN)并且一种。因此，现在所有时间都在发送数据之前进行计算。
令人困惑的是，您只查看了“持续时间”，而不是两次的总和。也就是说，总时间是需要注意的重要因素。
由于需要收集和排序 570 万行的额外步骤，DISTINCT 稍微慢一些(总时间)。

关于MySQL 独特的性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59786782/

文章推荐： wcf - 如何从nhibernate中的wcf获取经过身份验证的用户ID

文章推荐： r - 从存储在列表中的 data.frame 调用变量

文章推荐： ios - 如何禁用WKWebView中的弹跳效果

prometheus - 哪些用例真正使普罗米修斯的汇总指标类型成为必要/独特？
对于 Prometheus 指标集合，如标题，我真的找不到只能通过 type Summary 完成的用例。，似乎它们都可以通过 type Histogram 以某种方式完成还。让我们以请求并发度量
r - 不区分大小写独特保持原样
这个问题在这里已经有了答案: Ignore case while using duplicated (1 个回答) 关闭 9 个月前。使用不区分大小写的 unique(tolower(x)) 删除
azure - 如何收到新(独特)错误的警报
应用程序监控服务的一个有用功能是每次发生新的、独特的错误/问题/异常时发送警报(例如电子邮件)(即不是每次发生)。要么只是第一次，要么最多每次 X 次(一天或一周等)。例如，这可以通过 Visual
azure - 如何收到新(独特)错误的警报
应用程序监控服务的一个有用功能是每次发生新的、独特的错误/问题/异常时发送警报(例如电子邮件)(即不是每次发生)。要么只是第一次，要么最多每次 X 次(一天或一周等)。例如，这可以通过 Visual
group-by - DB2 独特 + xmlagg 查询
我想要相当于 DB2 中 MySql 的 GROUP_CONCAT 功能。我尝试过 DB2 的 XML Aggrigate 函数来合并 murows。 SELECT a.ID, sub
python - 雪花和 SQLAlchemy "unexpected ' 独特'
我正在运行 python 数据库迁移脚本 (Flask-Migrate) 并添加了 alembic.ddl.imp import DefaultImpl 来解决第一组错误，但现在我收到以下错误。我正在
bash - 排序 |独特 | xargs grep ... 其中行包含空格
我有一个逗号分隔的文件“myfile.csv”，其中第 5 列是日期/时间戳。 (mm/dd/yyyy hh:mm)。我需要列出所有包含重复日期的行(有很多) 我正在通过 cygwin 为 WinX
MySQL 5.7 | MySQL 5.7分组依据 |独特|聚合错误
我使用的是 MySQL 5.7。我有一个表格如下: -------------------------------------------------- | id | currentcy_id |
javascript - ng-repeat 中的 Angular 独特 ng-model
所以我有一个像这样的 ng-repeat: Join Ride /md-switch> 但是，每个 md-switch 都有相同的模型，因此当我在 Control
node.js - Mongoose 独特 :true pre-save hook calls hook before validation
据我了解， Mongoose 预保存 Hook 在将文档插入集合之前但在验证发生之后触发。因此，如果一次验证失败，则不会调用预保存 Hook 。就我而言，无论如何都会调用它们: 下面的简单代码的作用
awk - 重现 grep "my pattern"myfile.log |排序 |独特 | awk 中的 wc -l
如果我对我的目标文件执行此 grep，我会得到例如 275 作为结果。但是我想学习 awk，所以在 awk 中尝试了这个: awk 'BEGIN { count=0 } /my pattern/

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

MySQL 独特的性能