- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
经过 20 年的专业发展,我仍然发现自己对数据库性能的某些方面一无所知。这是那些时代之一。这里和其他地方有数以千计的关于表和索引碎片及其对性能影响的问题。我知道基本的注意事项,但有时似乎没有“好的”答案。这是我的问题,我经常遇到它:
表只是用来存储定义一对多关系的id对,我们以 friend 为例。 Friends 表只包含personId (int), friendId (int)。每一对当然都是独一无二的。 (因此,但可能与问题无关,每个关系的逆对也存在。)所以数据的一个非常小的样本将是:
1001, 1011
1001, 1012
1001, 1013
1011, 1001
1012, 1001
1013, 1001
etc...
人 1001 有 3 个 friend ,当然每个 friend 都有人 1001 作为 friend ,等等。这张表可能有数百万甚至数亿的关系(行),任何给定的人都会附近可能有数百个 friend 。并且它们会被频繁地插入和更新(实际上在这种情况下,一些现有的被删除,新的被添加,没有实际的行更新)并且没有特定的顺序。对于任何给定的插入批处理,它们可以按 personId、friendId 排序,但除此之外,随着时间的推移,大部分插入将是无序的。
此表的用途是查询给定人的所有 friend ,或内部连接到人的查询以分组和聚合与每个人的 friend 相关的其他数据等,您期望的典型用途一对多关系表。查询性能可能比插入性能更重要,但两者都很重要,因为两者都经常发生。示例查询:
SELECT p.Name FROM Friends f
INNER JOIN People p ON f.friendId = p.id
WHERE f.personId = @personId
以前想都没想就给表一个personId,friendId的复合主键,在SQL Server中默认创建成聚簇索引,就搞定了用它。但我以前从未处理过如此庞大且对性能至关重要的数据,所以我质疑这个决定。我看不出有什么方法可以以不会导致大量和频繁碎片化的方式构建这样的表。我的问题是:
是否有更好的方法来构建这些数据?
考虑到聚簇索引的两个 int 列代表表中的唯一数据,碎片是否可能像我假设的那样糟糕,如果是这样,这些条件下的碎片是否会导致严重的后果如我所料,性能受到影响?
(除非 RDBMS 中有一些我不熟悉的完全不同的概念,否则我假设第一个问题的答案是否定的。所以这主要是第二个问题我希望有人有良好的经验基础回答。顺便说一句,如果有区别的话,数据库是 SQL Azure。)
感谢你们中的那些 DBA 大师,他们提供了一些见解!
最佳答案
您只需要包括两个字段的聚簇索引。无论是否聚集,索引都是有序数据。如果您创建非聚集索引,您的数据将加倍,并且每个插入操作都需要加倍的资源,因为它将在堆(或 row_id 聚集索引)和非聚集索引中插入数据。但是查找操作将只使用非聚集索引,因为所有需要的数据都包含在其中。
所以制作聚簇索引并快乐:)
关于sql - 复合主键/聚集索引、碎片、性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21273595/
我想沿着一个轴从特定位置的X数组中分散并收集元素。 因此,给定一个索引数组idx,我想选择第0列的idx(0) th元素,第1列的idx(1) th元素,等等。 在Numpy中,以下语句: X = n
我有一个在集群硬件中运行的 Java 应用程序。我使用 Hashmap 作为缓存。我也希望缓存能够集群。有没有一些开源java项目可以在两台连接的机器上同步Hashmap? 最佳答案 看看 Hazel
这个问题在这里已经有了答案: Count number of times that an item occurred in each of multiple columns (4 个答案) 关闭 5
我一直在尝试“组合”一个列表 I mean putting items together depending on the item inbetween, so ['d','-','g','p','q
非聚集文件存储在数据文件中,聚集索引按逻辑索引顺序存储数据。 逻辑顺序位于哪里? 最佳答案 大多数 MySQL 索引的结构为 BTree。 (参见维基百科) (我在此讨论中排除了 FULLTEXT 和
所有源和目标都位于不可缓存的内存中。毫无疑问。在启动 DMA(即分散-聚集 DMA)之前,我构建了 DMA 链表(包含 src、dest、size 和 next)。我想我不必将列表放入不可缓存的内存中
我需要将输入字符串拆分为输出字符串(按一定顺序)通过在输入字符串上应用一组正则表达式。我想实现这个功能与 akka Actor 集群一起使用,我将其分散正则表达式和输入字符串并收集字符串。不过我想知道
Windows 文件系统支持scatter/gather IO .(当然,其他平台也可以) 但是不知道什么时候用IO机制。 你能给我解释一个合适的案例吗? 使用I/O机制我们能得到什么好处?(只是一点
我正在尝试使用克隆调用两个端点并收集它们的信息以通过聚合发送,我必须将其与分散收集中介器一起使用。每个端点返回一个 json 字符串。但我一直遇到“期望 SOAP Envelope 的实现作为父级”错
我想要实现的目标是使用户空间中的内存块可以通过 PCIe 直接由 FPGA 板中的 DMA 内核访问(不受内核的任何干扰)。 为此,我在用户空间中使用 posix_memalign() 在用户空间中分
假设我有以下数据框: > a a Source: local data frame [3 x 2] my_type_1_num_widgets my_type_2_num_widgets 1
我已经搜索了一段时间,但似乎无法在文档或 SO 上找到任何有用的信息。 This question并没有真正帮助我,因为它引用了修改程序集,而我正在用 C 语言编写。 我有一些代码进行间接访问,我想对
我已经坚持了一段时间了。我的代码基于 https://webrtc.org/getting-started/firebase-rtc-codelab .我基本上只是将其更改为 React 和 fire
我可以合并 Mono> 的列表吗?数据源整合为单个Mono>包含所有项目而不阻塞? 在我的带有 Lombok 分散收集应用程序的 JDK 9 Spring Boot 2 中,此阻塞版本有效:
我是一名优秀的程序员,十分优秀!