gpt4 book ai didi

mysql - 为什么单列选择和多列选择之间存在性能差异

转载 作者:搜寻专家 更新时间:2023-10-30 21:46:48 24 4
gpt4 key购买 nike

我有一个表 Report,它有 10 多个列,其中除了自动增量 id 之外的每个字段都是 varchar。表的任何行的最大大小为 ~80000 字节。

我观察到以下 2 个查询之间存在相当大的差异,其中服务器和客户端都在同一系统上(约 150 万行)(也有列名索引)

select * from Report;

&

select name from Report;

我经历了其他 stackoverflow 问题,其中 Ans 建议

"One reason that selecting specific columns is better is that it raises the probability that SQL Server can access the data from indexes rather than querying the table data. "

我的问题是:

1) 即使在使用索引时我们也需要从实际的数据库(即磁盘)中读取,所以相同的磁盘 I/O 将当我们选择单列或多列时执行(比如使用 *)。

2) 有人能解释一下为什么单列选择和多列选择之间存在差异吗?据我了解,数据库会尝试将完整的行存储在同一磁盘扇区中。

假设对 User 表进行一些查询,例如

select first_name from user & 
select first_name, age from user

3) DB 是否执行相同的磁盘 I/O(对于上述查询),或者磁盘 I/O 可能不同,如果用户表有超过 10 列并且我们选择 5~8 列磁盘 I/O 仍然存在怎么办一样吗?

已经在其他答案中读到,使用 select * 是不可取的,它可能会导致 View 和维护问题(向数据库添加新列时的情况)

这可能是一个愚蠢的问题,因为仍在学习数据库(新手到主题)。如果某些问题已在任何地方得到解答,请提供链接。

最佳答案

你的假设是错误的。如果索引包含所有选定的列,SQL Server 将不会访问磁盘来获取它们,它会从索引数据中检索它们。索引比数据页更有可能保存在内存中,因此查询可能根本不必访问磁盘。

如果您的select 包含您不需要但未包含在任何索引中的列,服务器将无缘无故地从磁盘读取数据。

另一件发生变化的是网络 I/O。生产服务器可能必须每分钟为数百个客户端提供数千个查询。在数据中包含无用的列会影响所有客户端。如果您考虑在可能有数千个客户端的流行网站中使用的服务器,情况会更糟。

关于mysql - 为什么单列选择和多列选择之间存在性能差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25662145/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com