具有多个共享列的 MySql 索引策略-6ren

具有多个共享列的 MySql 索引策略

转载作者：行者123 更新时间：2023-11-29 11:03:23

26

4

我们有一个数据库表，用于存储访问者的浏览器数据，并按多个不同的子类型进行分割。为简单起见，我们使用下面的表架构。查询基本上将针对任何单个 id 列、指标列、时间戳列(存储为自纪元以来的秒数)以及设备、浏览器或操作系统列之一。

我们将对星型与雪花架构进行性能测试(其中所有 id 都进入单个列，但随后添加一个附加列 id_type 以确定它是哪种类型的标识符)对于这个表，但只要星型模式(现在就是这样)在雪花性能的 80% 以内，我们就会保留它，因为它将使我们的加载过程变得更加容易。不过，在此之前，我想确保索引在星型模式上进行了优化。

create table browser_data (
id_1 int,
id_2 int,
id_3 int,
id_4 int,
metric varchar(20),
browser varchar(20),
device varchar(20),
os varchar(20),
timestamp bigint
)

仅在 id 列上创建单独的索引更好，还是在这些索引中也包含 metric 和 timestamp 列？

最佳答案

不要标准化“连续”值，例如DATETIME、FLOAT、INT。一定将值保留在主表中。

当您将值移动到其他表(尤其是“雪花”)时，它会使基于值的查询速度变慢一点到慢很多。当您需要过滤主表中不存在的多个指标时，尤其会发生这种情况。由于“雪花”或“过度标准化”，其中任何一个都表现得很差:

WHERE a.x = 123 AND b.y = 345

ORDER BY a.x, b.y

至于创建什么索引——这完全取决于您需要执行的查询。因此，我强烈建议您根据暂定的CREATE TABLEs勾勒出可能的SELECTs。

INT 是 4 个字节。 TIMESTAMP 是 5，FLOAT 是 4，等等。也就是说，标准化这些东西在空间上也是低效的。

更多

在执行JOIN时，优化器几乎总是从一个表开始，然后移至另一个表，依此类推。(请参阅“嵌套循环联接”。)

例如(基于上面的“代码”)，当 2 列标准化时，并且您正在测试这些值，您手中没有两个 id，您只有两个值(value)观。这使得查询执行效率非常低。对于

SELECT ...
    FROM main
    JOIN a  USING(a_id)
    JOIN b  USING(b_id)
    WHERE a.x = 123 AND b.y = 345

以下很可能是“执行计划”:

进入 a 查找 x=123 的行；获取这些行的id。这可能包括许多尚未由 b.y 过滤的行。 a 需要 INDEX(x)
返回主表，查找具有这些 ID 的行。 main 需要 INDEX(a_id)。同样，可能会拖拽超出必要数量的行。
只有现在，您才能访问 b(使用 b_id)来检查 y=345；扔掉你拖来拖去的不必要的行。 b 需要 INDEX(b_id)

请注意我关于“四处走动”的评论。盲目使用 * (在 SELECT * 中)会增加问题 - 在执行步骤时所有列都会被拖拽。

另一方面...如果x和y位于main表中，那么代码的工作方式如下:

WHERE main.x = 123
  AND main.y = 345

只需要INDEX(x,y)(无论顺序)。它可以快速准确地定位所需的行。

对于ORDER BY a.x, b.y，它不能在任何表上使用任何索引。因此，查询必须创建一个临时表，对其进行排序，然后按所需的顺序传递行。

但如果 x 和 y 位于同一个表中，则 INDEX(x,y) (按该顺序)可能对 ORDER BY x,y 有用，并避免使用 tmp 表和排序。

对于单个表，优化器可能会使用 WHERE 索引，也可能会使用 ORDER BY 索引，具体取决于月相。在某些情况下，一个索引可以同时用于两者——这是最佳的。

另一个注意事项:如果您还有 LIMIT 10，...如果避免 sort，则只需查看 10 行，而不是整个集合来自WHERE。

关于具有多个共享列的 MySql 索引策略，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41834053/

26

4

0

文章推荐： mysql - 我正在尝试导出 MySQL 表，但收到 --secure-file-priv

文章推荐： MySQL按两个不同维度分组

文章推荐： html - laravel 5按钮连接数据库

文章推荐： java - 防止在 Spring Hibernate 中存储重复值的正确方法

三种缓存策略：Cache Aside 策略、Read/Write Through 策略、Write Back 策略
作者：小林coding 计算机八股文网站：https://xiaolincoding.com 大家好，我是小林。今天跟大家聊聊，常见的缓存更新策略。 Cache Aside（旁路缓存）策略； Rea
git - Mercurial merge 策略 vs Git merge 策略
我使用 git 多年，最近为了一个项目改用 mercurial。在过去的 6 个月里，我已经学会了如何通过命令行很好地使用 Mercurial。这可能是我的想象，但在我看来，mercurial 在
oauth-2.0 - Passport & JWT & Google/Facebook 策略 - 我如何结合 JWT 和 Google/Facebook 策略？
这个问题适合任何熟悉的人 Node.js express Passport 带有 Passport 的 JWT 身份验证(JSON Web token ) Facebook OAuth2.0 或谷歌
记录平等的 Coq 策略？
在 Coq 中，当试图证明记录的相等性时，是否有一种策略可以将其分解为所有字段的相等性？例如， Record R := {x:nat;y:nat}. Variables a b c d : nat.
javascript Bootstrap 策略
我正在处理的项目目前只有一个 Bootstrap 文件，用于初始化应用程序中的所有 javascript 对象。类似于下面的代码 if(document.getElementById('nav'))
ubuntu - OpenLDAP 策略
我正在考虑使用 OpenLDAP 在首次登录时添加密码到期和强制更改密码。似乎使用 ppolicy 覆盖来实现这一点。当我在 ppolicy.schema 中看到这个时，我开始使用 ppolicy
避免显卡敏感性的 WPF 策略？
这基本上是我昨天问的一个问题的重新陈述，因为我得到的一个答案似乎没有理解我的问题，所以我一定是不清楚。我的错。因为 WPF 依赖于 DirectX，所以它对卡和驱动程序的内部非常敏感。我有一个案例，
SAML NameId 策略
我是单点登录(SSO)概念的新手。我开始知道 SAML 请求和响应是实现 SSO 流程的最佳方式。然后我开始阅读有关 SAML2.0 的信息。我来了一个术语 NameIdPolicy 在 saml1.
新雪豹用户的 Perl 策略？
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 5年前关闭。 Improve this questi
.NET 混淆工具/策略
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 9 年前。 Improv
用于限制数据库扩展的 Azure 策略
在 Azure 上创建新的 SQL 数据库时，它将“计算+存储”选项设置为“2 vCore + 32GB 数据最大大小”作为默认配置，但我不想使用 vCore，我可以更改它。但问题是，是否可以通过策略
Azure 策略 - 防止在未经身份验证的情况下创建应用程序服务
我希望创建一项策略，防止在未启用身份验证的情况下创建应用服务(仅审核它们是不够的)。以下策略可以正确识别未启用身份验证的现有资源: { "mode": "All", "policyRule"
Azure 策略创建一个deployifnotexists 策略
我正在尝试从现有 AuditIfNotExists 策略创建 DeployIfNotExists 策略。部署时不会出错，但会错误提示“没有相关资源与策略定义中的效果详细信息匹配”。当评估政策时。当我将
Azure 策略创建一个deployifnotexists 策略
我正在尝试从现有 AuditIfNotExists 策略创建 DeployIfNotExists 策略。部署时不会出错，但会错误提示“没有相关资源与策略定义中的效果详细信息匹配”。当评估政策时。当我将
Django json 策略？
我正在使用 wunderground 的 json api 来查询我网站上的天气状况。 api 为我提供了一个包含所有必要数据的漂亮 json 对象，但我每天只能进行多次调用。存储这些数据的首选方式是
Java OOP 策略
我有一个名为可视化数据结构的项目。我有这样的 OOP 设计。 Class VisualDataStructures extends JFrame Class ControlPanel extends
javascript "include"策略
这个问题在这里已经有了答案: 关闭 14 年前。副本: Use javascript to inject script references as needed? Javascript 没有任何指
Android StrictMode 策略
Android 应用程序遇到了一些 ANR 问题，因此我实现了 StrictMode 策略。以前从未使用过这个，所以希望有人可以帮助解释以下内容: 为什么日志显示 2 个看似相似的违规行为，除了前 4
algorithm - 寻找酒店谜语的算法/策略
我目前正在尝试解决一个问题。假设我们在路上行驶，我们知道路上有 10 家酒店。每家酒店都有 0 到 6 星。我的问题是:找到选择星级酒店的最佳解决方案。唯一的问题是:您不能回头去参观您已经决定不去的酒
安卓 MVP 策略
我正在将我的应用程序迁移到 MVP。从这个 konmik 中获得了有关静态演示者模式的提示这是我的简要 MVP 策略。为简洁起见，删除了大部分样板和 MVP 监听器。这个策略帮助我改变了方向，证明了

首页

博学

6Ren·AI

商城

具有多个共享列的 MySql 索引策略