- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
考虑到性能改进,我想知道哪些索引对连接表(特别是在 Rails 3 has_and_belongs_to_many 上下文中使用)是否有帮助以及哪些索引有帮助。
我的型号是Foo
和Bar
根据 Rails 约定,我有一个名为 bars_foos
的连接表。没有主键或时间戳使得此表中的旧字段 bar_id:integer
和foo_id:integer
。我有兴趣知道以下哪个索引最好并且没有重复:
add_index :bars_foos, [:bar_id, :foo_id]
add_index :bars_foos, :bar_id
add_index :bars_foos, :foo_id
基本上,我不确定复合索引是否足够,假设它一开始就有帮助。我相信复合索引可以用作第一个项目的单个索引,这就是为什么我非常确信使用所有三行肯定会导致不必要的重复。
最常见的用法将给出模型 Foo
的实例,我将询问其关联的 bars
使用 foo.bars
的 RoR 语法反之亦然 bar.foos
对于模型 Bar
的一个实例.
这些将生成 SELECT * FROM bars_foos WHERE foo_id = ?
类型的查询和SELECT * FROM bars_foos WHERE bar_id = ?
分别然后使用这些结果 ID 来 SELECT * FROM bars WHERE ID in (?)
和SELECT * FROM foos WHERE ID in (?)
.
如果我不正确,请在评论中纠正我,但我不相信,在 Rails 应用程序的上下文中,它会尝试执行指定两个 ID(如 SELECT * FROM bars_foos where bar_id = ? AND foo_id = ?
)的查询。 .
如果有特定于数据库的优化技术,我很可能会使用 PostgreSQL。然而,使用此代码的其他人可能希望在 MySQL 或 SQLite 中使用它,具体取决于他们的 Rails 配置,因此我们感谢所有答案。
最佳答案
经常重复的答案往往是“这取决于情况”。更具体地说,这取决于您的数据是什么以及如何使用这些数据。
针对我的具体案例(并涵盖所有 future 基础)的简短 tl;dr 答案是选择#2,这正是我所怀疑的。但是,选择 #3 效果很好,因为根据我对数据的使用情况,创建复合索引所使用的额外时间和空间可以减少 future 的查询查找。
这样做的原因是数据库试图变得智能并尝试尽可能快地完成任务,而不管程序员的输入如何。添加索引时要考虑的最基本的事项是该对象是否可以通过该键查找。如果是,索引可能有助于加快速度。然而,是否使用该索引完全取决于字段的选择性和基数。
由于外键通常是另一个 AR 类的 ID,因此基数通常会很高。但同样,这取决于您的数据。在我的示例中,如果有许多 Foo
而很少 Bar
,则连接表中的许多条目将具有类似的 bar_id
。由于 bar_id
的基数较低,因此 bar_id
上的索引可能永远不会被使用,并且可能会因为让数据库投入时间和资源*来添加索引而造成妨碍每次创建新的 bars_foos
条目时都会索引。对于许多 Bar
和少量 Foo
以及两者都很少的情况也是如此。
一般的教训是,在考虑表上的索引时,确定是否通过该字段查找条目以及该字段是否具有高基数。也就是说,这个字段是否有许多不同的值?对于大多数连接表来说,“这取决于”,我们必须更仔细地考虑数据代表什么以及关系本身。就我而言,我将同时拥有许多 Foo
和 Bar
,并且将通过以下方式查找 Foo
:它们相关的bar
,反之亦然。
我在办公室得到的另一个很好的答案是,“你为什么担心你的索引?构建你的应用程序!”
* 在类似的问题中on indexes on STI有人指出,索引的成本非常低,因此当有疑问时,只需添加它即可。
关于ruby-on-rails - 连接表的最佳 SQL 索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10790518/
我有一台 MySQL 服务器和一台 PostgreSQL 服务器。 需要从多个表中复制或重新插入一组数据 MySQL 流式传输/同步到 PostgreSQL 表。 这种复制可以基于时间(Sync)或事
如果两个表的 id 彼此相等,我尝试从一个表中获取数据。这是我使用的代码: SELECT id_to , email_to , name_to , status_to
我有一个 Excel 工作表。顶行对应于列名称,而连续的行每行代表一个条目。 如何将此 Excel 工作表转换为 SQL 表? 我使用的是 SQL Server 2005。 最佳答案 这取决于您使用哪
我想合并两个 Django 模型并创建一个模型。让我们假设我有第一个表表 A,其中包含一些列和数据。 Table A -------------- col1 col2 col3 col
我有两个表:table1,table2,如下所示 table1: id name 1 tamil 2 english 3 maths 4 science table2: p
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 1 年前。 Improve th
下面两个语句有什么区别? newTable = orginalTable 或 newTable.data(originalTable) 我怀疑 .data() 方法具有性能优势,因为它在标准 AX 中
我有一个表,我没有在其中显式定义主键,它并不是真正需要的功能......但是一位同事建议我添加一个列作为唯一主键以随着数据库的增长提高性能...... 谁能解释一下这是如何提高性能的? 没有使用索引(
如何将表“产品”中的产品记录与其不同表“图像”中的图像相关联? 我正在对产品 ID 使用自动增量。 我觉得不可能进行关联,因为产品 ID 是自动递增的,因此在插入期间不可用! 如何插入新产品,获取产品
我有一个 sql 表,其中包含关键字和出现次数,如下所示(尽管出现次数并不重要): ____________ dog | 3 | ____________ rat | 7 | ____
是否可以使用目标表中的LAST_INSERT_ID更新源表? INSERT INTO `target` SELECT `a`, `b` FROM `source` 目标表有一个自动增量键id,我想将其
我正在重建一个搜索查询,因为它在“我看到的”中变得多余,我想知道什么 (albums_artists, artists) ( ) does in join? is it for boosting pe
以下是我使用 mysqldump 备份数据库的开关: /usr/bin/mysqldump -u **** --password=**** --single-transaction --databas
我试图获取 MySQL 表中的所有行并将它们放入 HTML 表中: Exam ID Status Assigned Examiner
如何查询名为 photos 的表中的所有记录,并知道当前用户使用单个查询将哪些结果照片添加为书签? 这是我的表格: -- -- Table structure for table `photos` -
我的网站都在 InnoDB 表上运行,目前为止运行良好。现在我想知道在我的网站上实时发生了什么,所以我将每个页面浏览量(页面、引荐来源网址、IP、主机名等)存储在 InnoDB 表中。每秒大约有 10
我在想我会为 mysql 准备两个表。一个用于存储登录信息,另一个用于存储送货地址。这是传统方式还是所有内容都存储在一张表中? 对于两个表...有没有办法自动将表 A 的列复制到表 B,以便我可以引用
我不是程序员,我从这个表格中阅读了很多关于如何解决我的问题的内容,但我的搜索效果不好 我有两张 table 表 1:成员 id*| name | surname -------------------
我知道如何在 ASP.NET 中显示真实表,例如 public ActionResult Index() { var s = db.StaffInfoDBSet.ToList(); r
我正在尝试运行以下查询: "insert into visits set source = 'http://google.com' and country = 'en' and ref = '1234
我是一名优秀的程序员,十分优秀!