- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
FK Distinct Values %
---- --------------- ------
Id1 1 0.1%
,Id2 4 0.3%
,Id3 5 0.3%
,Id4 6 0.4%
,Id5 6 0.4%
,Id6 95 6.1%
,Id7 97 6.2%
,Id8 1423 90.7%
所有外键都已经组成了集群Primary Key
。此事实表是包含 6 个维度(Id 的 6、7 和 8 引用相同的日期维度)的星型模式的一部分。
事实表目前大约有 1800 行(小得令人难以置信),并且预计每个月都会增长该数量。
每个外键都应该有自己的非聚集非唯一单列索引以促进连接吗?如果是这样,为什么?
每个外键都将成为其维度表中聚簇索引(主键)的一部分。
如果应该在外键上放置索引,那么应该将填充因子和填充索引设置为多少,因为列的基数较低?
最佳答案
您的个人资料中的“%”列并没有真正意义 - 为什么要找到跨字段的不同值的“百分比”?您需要有关不同值分布的统计信息——Id8 上 99% 的键是否相同?它们分布均匀吗?等
请注意,我在这里所说的一切都适用于更大的表。每月 1800 行,索引可能会浪费您的空间和时间。
@jrara 关于索引所有 dims 的“规则”是一个易于应用的规则,但如果仅此而已,则很容易出错。例如,我不想在我的 1 亿行客户维度上使用 oracle 位图索引。
索引取决于针对您的数据的查询。如果您正在对事实表进行全面扫描以对“摘要”报告执行聚合和分组,则索引将无济于事。当用户试图过滤维度的属性时,它们会有所帮助,并且该过滤器导致您只需从事实表中查找一小部分记录。你的 table 有一个主要的入口点吗?人们通常会根据“Id8”维度的属性进行过滤,然后希望根据其他维度的属性进行分组吗?
基本上您的问题的答案是:
是否每个外键都有自己的非聚集非唯一单列索引以促进连接?
一般来说,是的,只要维度表很小,并且暗键在事实表中分布相对均匀。通常使用索引访问获取 99% 的事实表行会更糟。
鉴于列的基数较低,应将填充因子和填充索引设置为多少?
将 FILLFACTOR 降低到 100% 以下将导致索引读取变慢,因为索引中有更多(空)页供 DB 读取。由于数据仓库是为快速选择而设计的,所以我真的不建议您向下调整填充因子。
话虽这么说,在少数情况下,调整您的 FILLFACTOR 可能是有意义的。如果事实表非常大(数百 GB/TB),并且重建索引需要数小时,并且您可能每月只重建一次索引甚至更少。在这些情况下,您需要计算出每天要添加到表中的数据量(百分比),并相应地设置填充因子。
关于sql-server-2008 - 我应该在事实表中的这些外键上放置一个非聚集索引吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13504204/
我想沿着一个轴从特定位置的X数组中分散并收集元素。 因此,给定一个索引数组idx,我想选择第0列的idx(0) th元素,第1列的idx(1) th元素,等等。 在Numpy中,以下语句: X = n
我有一个在集群硬件中运行的 Java 应用程序。我使用 Hashmap 作为缓存。我也希望缓存能够集群。有没有一些开源java项目可以在两台连接的机器上同步Hashmap? 最佳答案 看看 Hazel
这个问题在这里已经有了答案: Count number of times that an item occurred in each of multiple columns (4 个答案) 关闭 5
我一直在尝试“组合”一个列表 I mean putting items together depending on the item inbetween, so ['d','-','g','p','q
非聚集文件存储在数据文件中,聚集索引按逻辑索引顺序存储数据。 逻辑顺序位于哪里? 最佳答案 大多数 MySQL 索引的结构为 BTree。 (参见维基百科) (我在此讨论中排除了 FULLTEXT 和
所有源和目标都位于不可缓存的内存中。毫无疑问。在启动 DMA(即分散-聚集 DMA)之前,我构建了 DMA 链表(包含 src、dest、size 和 next)。我想我不必将列表放入不可缓存的内存中
我需要将输入字符串拆分为输出字符串(按一定顺序)通过在输入字符串上应用一组正则表达式。我想实现这个功能与 akka Actor 集群一起使用,我将其分散正则表达式和输入字符串并收集字符串。不过我想知道
Windows 文件系统支持scatter/gather IO .(当然,其他平台也可以) 但是不知道什么时候用IO机制。 你能给我解释一个合适的案例吗? 使用I/O机制我们能得到什么好处?(只是一点
我正在尝试使用克隆调用两个端点并收集它们的信息以通过聚合发送,我必须将其与分散收集中介器一起使用。每个端点返回一个 json 字符串。但我一直遇到“期望 SOAP Envelope 的实现作为父级”错
我想要实现的目标是使用户空间中的内存块可以通过 PCIe 直接由 FPGA 板中的 DMA 内核访问(不受内核的任何干扰)。 为此,我在用户空间中使用 posix_memalign() 在用户空间中分
假设我有以下数据框: > a a Source: local data frame [3 x 2] my_type_1_num_widgets my_type_2_num_widgets 1
我已经搜索了一段时间,但似乎无法在文档或 SO 上找到任何有用的信息。 This question并没有真正帮助我,因为它引用了修改程序集,而我正在用 C 语言编写。 我有一些代码进行间接访问,我想对
我已经坚持了一段时间了。我的代码基于 https://webrtc.org/getting-started/firebase-rtc-codelab .我基本上只是将其更改为 React 和 fire
我可以合并 Mono> 的列表吗?数据源整合为单个Mono>包含所有项目而不阻塞? 在我的带有 Lombok 分散收集应用程序的 JDK 9 Spring Boot 2 中,此阻塞版本有效:
我是一名优秀的程序员,十分优秀!