MySQL 在复杂查询中连接小表和大表

MySQL 在复杂查询中连接小表和大表 - 它们有多消耗？

转载作者：行者123 更新时间：2023-11-29 14:03:44

25

4

假设数据库很大。我对搜索结果页面有一个非常复杂的查询。在下面的查询中，您可以看到我从 user_profile 表中检索了一些属性值 id，例如教育就是一个属性。当我有属性教育的值 id 时，我从数组(php 代码)中检索该 id 的标签名称，其中 id 是数组键。

  public static $education        = array(0 => 'No answer', 
                                          1 => 'High school',
                                          2 => 'Some college',
                                          3 => 'In college',
                                          4 => 'College graduate',
                                          5 => 'Grad / professional school',                                    
                                          6 => 'Post grad');

大约 10 个其他属性也类似。否则我的查询会更加复杂，我需要创建表 attribute_id_label 并为每个属性创建另一个联接以检索每个属性的值 id 的标签名称。这意味着额外的 10 个连接可能会减慢查询速度。但这仍然是正确的方法。

所以我的问题是:如果表 attribute_id_label 只有大约 500 条记录。由于该表非常小，因此对该表进行 10 次连接是否会产生很大的影响？即使表 user_profile 非常大并且查询已经相当复杂(如您所见)？

这是我的查询:

    SELECT 
    group_concat(DISTINCT looking.looking_for SEPARATOR ',') as lookingFor, 
    group_concat(DISTINCT photo.photo ORDER BY photo.photo_id DESC SEPARATOR ',') as photos, 
    profile.user_id as userId, 
    url as profileUrl, 
    nickname, 
    avatar.photo, 
    city, 
    ethnicity, 
    education, 
    occupation, 
    income, 
    //and 10 more fields like education, occupation, ethnicity...
    FROM user_profile profile 
    LEFT JOIN user_profile_photo photo ON photo.user_id=profile.user_id 
    LEFT JOIN user_profile_photo avatar ON avatar.photo_id=profile.photo_id 
    INNER JOIN user_profile_looking_for looking ON looking.user_id=profile.user_id 
    LEFT JOIN user_profile_txt txt ON txt.user_id = profile.user_id 
    INNER JOIN place a ON a.place_id=profile.place_id 
    INNER JOIN (SELECT lat, lon FROM place WHERE place_id = :place_id) b ON (3959 * acos( cos( radians(b.lat) ) * cos( radians( a.lat ) ) * cos( radians( a.lon ) - radians(b.lon) ) + sin( radians(b.lat) ) * sin( radians( a.lat ) ) ) ) < :within 
    GROUP BY profile.user_id LIMIT 0,12

大多数属性不会由用户填充，既然您建议不可为空，那么对于那些未填充的属性最好使用什么？我可以为每个属性使用额外字段没有答案。每个属性都会有额外的值(value) 没有答案。让我们以教育和愿望属性为例。属性 education 有 id 1，want 是 2。

eav_attribute_option 
option_id | attr_id | label 
1 | 1 | No answer 
2 | 1 | High school 
3 | 1 | ...  
4 | 2 | No answer 
5 | 2 | Opportunities 
6 | 2 | ...

但现在问题又重复了每个属性都没有答案值。但这是避免 NULL 值的方法。我不确定这是否正确。

最佳答案

我做过很多此类代码表工作。它通常对性能的帮助大于损害。 @alxklx 指出了事实:您必须确保您的代码表(例如教育)格式良好。也就是说，

education_id 列必须是 codelist 表中的唯一主键。
education_id 列应该是简单的原始数据类型。也就是说，将其设置为 int，而不是 decimal 或 varchar。
当 education_id 显示在您的数据表中时，它必须与您在 codelist 表中使用的数据类型相同，并且必须不可为 NULL。换句话说，不要在数据表中使用 NULL 来指示丢失的数据。

如果你做了这些事情，你的 JOIN 就会看起来很简单

  FROM people p
  JOIN education e ON p.education_id = e.education_id

RDBMS 的优化器知道它们是简单的 1:1 连接。

总而言之，任何复杂的查询在将其放入实时系统之前都需要检查其功能和性能。

如果您的人员中缺少数据，请使用 0 或 1 的 education_id(或其他一些 attribute_id)。在每个代码列表表中放置一行，id 为零或一，值为“未知”或“用户没有告诉我们”或任何有意义的值。 (您可以根据应用的便利性选择零或一。我更喜欢零，但这只是个人喜好。)

关于MySQL 在复杂查询中连接小表和大表 - 它们有多消耗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14687288/

25

4

0

文章推荐： php - 创建复杂的 SQL 语句 - CakePHP

文章推荐： mysql - 使用复合主键与简单索引的性能有什么区别？

文章推荐： MYSQL无法在Windows 7上启动服务

文章推荐： php mysql 选择哪里

spring - 消耗 HATEOAS 资源
我有一个简单的 HATEOAS 使用构建的提供程序 Spring 这为我提供了以下资源: { "_links" : { "self" : { "href" : "http:/
Clojure 函数体中不同位置的惰性 seq 消耗
这里是 Clojure 初学者，不确定问题中的术语是否正确。我正在使用 clj-webdriver 出租车 API 构建网络抓取工具。它需要从多个站点抓取数据。以下实际上不是项目中的代码，但我已经对
c++ - 如何通过固定线程循环周期最小化 CPU 消耗
我使用pthread lib 2.8，操作系统内核是arm上的Linux 2.6.37。在我的程序中，线程 A 使用 pthread 接口(interface)将调度优先级设置为 sched_get_
c++ - 打开文件时的 RAM 消耗
我有一个大约 400MB 的二进制文件，我想将其转换为 CSV 格式。输出的 CSV 文件将约为 1GB(根据我的计算)。我读取二进制文件并将其存储在一个结构数组中(其他处理也需要)，当用户想要将其
c++ - 串行端口线程的 CPU 消耗
我在编写我的专业应用程序时遇到一个串口线程问题。我有cpu消耗。当我在我的项目中添加 SerialCtrl.h(来自项目 SerialCtrl http://www.codeproject.com/A
c - 由于可变排序而导致不同的 RAM 消耗
总结:似乎 c 代码的 RAM 消耗取决于变量排序。有没有办法自动优化？更长的版本:在这里，我粘贴了两个版本的代码，它们仅在变量排序方面有所不同。版本 1: static unsigned lon
C#:使用位图时如何减少内存和 CPU 消耗？
我有一个处理图像编辑(裁剪和调整大小)的 Windows 应用程序项目。不幸的是，这些图像处理会消耗大量内存和 CPU 资源(很容易达到 600MB 或 50% cpu)，而且它只是裁剪和调整大小 2
c++ - 为什么在类实例化期间没有 CPU 消耗？
我创建了一个实例化类 10 亿次的循环，并且非常惊讶地看到它在 0 毫秒内运行并且根据 Windows 任务管理器没有消耗 CPU 时间。正如您从下面的代码中看到的那样，我显然没有对默认构造函数执行
java - 用户名的正则表达式会增加 CPU 消耗
我们有以下用户名验证规则: 用户名可以包含字母数字字符用户名可以有下划线、连字符或句号现在假设用户名是 ASCII 用户名不能以句点开头或结尾用户名不能开始、结束或有任何空格我们有以下相同的正
c# - 列出所有进程及其当前内存和 CPU 消耗？
如何获取 C# 中所有进程的列表，然后获取每个进程的当前内存和 CPU 消耗？非常感谢示例代码。最佳答案 Process class有一个 GetProcesses 方法，可以让您枚举正在运行的进
c - 如何限制进程中的 RAM 消耗？
如何从 linux 2.6.32 机器上的源代码中限制 C 程序的物理内存消耗？我需要确定系统使用的页面替换算法的类型。问题是，如果不限制一个进程在内存中可以拥有的页面数量，就很难分析页面错误的模
linux - 跟踪线程内存和 CPU 消耗
我正在编写一个 Linux 应用程序，它观察其他应用程序并跟踪资源消耗。我计划使用 Java，但编程语言对我来说并不重要。目标很重要，所以我可以切换到另一种技术或使用模块。我的应用程序将任何选定的第三
Java，JCheckbox - 消耗/阻止所有事件，但仍然启用
我有一个图标，旁边有一个复选框，包含在一个面板中。面板有悬停效果，点击面板时想选中框。我想使用或阻止复选框的所有事件，仅以编程方式选择它。我希望该框在屏幕上显示为“已启用”，而“在幕后”几乎不起作用
javascript - 消耗 angular.js 剩余请愿书的所有记录
我正在使用服务 REST，它当前有 5025 条记录，但当我使用该服务时，只出现 1,000 条记录。我可以做什么来完全消耗所有记录？这是我的代码示例: $http({ method:
Azure 存储帐户 - 跟踪 SAS 消耗
我已经搜索了几个小时但没有成功，是否可以跟踪 Blob 容器上 SAS 凭据的消耗情况？我将向几个客户提供 SAS 凭证，并且我希望能够跟踪他们的 SAS 使用情况(操作次数、带宽使用情况...)
azure - Azure 中的意外 RAM 消耗
我创建了具有 1.75 GB RAM 的 B1 应用服务计划。我还创建了一个应用程序服务并向其部署了 docker 镜像。现在我停止了 docker 镜像，它的状态已停止，并且它是该应用程序服务计划中
azure - Hololens 项目 Azure 消耗
与我们的合作伙伴一起为我们的客户(一家售后汽车零部件零售商)开发一个项目，他们利用 AR 和 VR 做了很多很酷的事情。我们的想法是使用 Hololens 并尝试帮助我们的客户在其大型仓库中进行物流操
haskell - Haskell 和流融合不断增加 CPU 消耗
这是一个简短的 Haskell 程序，可以生成 440 Hz 的声音。它使用pulseaudio作为音频后端。 import GHC.Float import Control.Arrow import
java - Vaadin 消耗 REST 和性能
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
JAVAFX tab onCloseRequest 消耗 tabPane
tab.setOnCloseRequest(e -> { if (getEditorForTextArea(getSelectedTextArea()) != null

首页

博学

6Ren·AI

商城

MySQL 在复杂查询中连接小表和大表 - 它们有多消耗？