gpt4 book ai didi

oracle - 在这种情况下使用分区是个好主意吗?

转载 作者:行者123 更新时间:2023-12-02 02:35:19 26 4
gpt4 key购买 nike

上下文:Oracle 10 数据库。

在一个相当大的表(几百万条记录)中,我们最近开始看到一些性能问题。该表有一些特殊的行为/条件。

  • 它大多只写一次,然后就不会再改变
  • 在第一天左右,记录从 0..N 开始分类(我们称之为列类)。记录可能会在第一天被重新分类多次
  • 添加新条目,类别 0 表示“尚未分类”
  • 大约每隔一小时,进程就会对新记录进行分类,并为它们提供从 1..N 开始的新类别
  • 所有读者只对第 1 类感兴趣
  • 所有超过一天的记录几乎不会改变它们的类别,> 1 条记录会在几天后被清理

现在,由于大多数访问都是针对类 1 进行的,因此该列经常与其他条件一起参与查询 (class = 1)。我们在类列上有一个索引,然后在某些其他列上也有一个索引。

对于我的问题:我们现在正在考虑按类别对该表进行分区。据我所知,这将使索引/处理数据更快,因为 class = 1 已经与其余数据分开,因此对它的访问隐式更有效。这是正确的吗?

如果您同意这是一个好主意,我将进一步阅读该主题!

谢谢干杯

更新2010年11月30日

非常感谢您的投入。我不知道这是一个额外的选择:)感谢您指出这一点(在我投入太多时间之前)。但除了许可证问题之外,在我看来,分区在这种情况下不一定是一个好的解决方案。

最佳答案

哪些操作速度缓慢?您是否能够确定这些操作速度缓慢的原因?

如果按类分区,则会减慢更新行类的过程。由于这会强制一行从一个分区移动到另一个分区,因此您会将更新转换为从第一个分区删除并插入到第二个分区。如果您的每小时进程很慢并且很慢是因为需要时间来查找所有新记录,那么这里的性能权衡可能是相当合理的。另一方面,如果您的每小时进程很慢,因为需要时间来计算新类应该是什么并更新所有行,那么这种权衡可能是一个非常糟糕的主意。

由于分区是企业版许可证之上的额外成本选项,因此我建议确保您不能使用某些基于函数的索引以相对较低的成本获得您目标的大部分性能改进。例如,如果您有两个基于函数的索引

CREATE INDEX idx_new_entries
ON your_table( (CASE WHEN class = 0 THEN primary_key ELSE null END) );

CREATE INDEX idx_class1_entries
ON your_table( (CASE WHEN class = 1 THEN primary_key ELSE null END) );

以及一些观点

CREATE VIEW vw_new_entries
AS
SELECT (CASE WHEN class = 0 THEN primary_key ELSE null END) primary_key,
<<list of columns>>
FROM your_table
WHERE class = 0

CREATE VIEW vw_class1_entries
AS
SELECT (CASE WHEN class = 1 THEN primary_key ELSE null END) primary_key,
<<list of columns>>
FROM your_table
WHERE class = 1

然后,针对在 PRIMARY_KEY 上筛选的新 View 的任何查询都将使用基于函数的索引,而该索引又只会对基础表中的相应行进行索引。这可以让您提高查找性能,而无需诉诸分区。

关于oracle - 在这种情况下使用分区是个好主意吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4306360/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com