gpt4 book ai didi

oracle - 在 Oracle 中为大表的新列创建索引

转载 作者:行者123 更新时间:2023-12-01 14:33:08 24 4
gpt4 key购买 nike

我有一个超过 1000 万行的表。我在该表上创建了一个新列,然后尝试对其进行索引:

create index myTable_idx_myColumn on myTable(myColumn);

该查询在大约一个小时后超时。然后我用 NOLOGGING 重试了它选项,并在大约一个小时后成功完成。

问题解决了对吧?不幸的是没有,因为那只是针对开发数据库。 prod 数据库有超过 2500 万行,所以理想情况下,我想在创建索引之前找到一个更快的解决方案,以避免不必要的停机时间。

令我感到奇怪的是,据我所知,Oracle 不包括 null默认情况下索引的值(这是我想要的)。对我来说,这意味着它应该只创建一个空白索引,因为新列中的所有值都是 null创建索引时。我知道它需要检查所有 1000 万行以确保它们是 null ,但即便如此,它似乎也不需要接近一个小时......

有没有一种快速的方法可以将索引添加到大表上的新列(即所有值都是 null )?

最佳答案

有一些方法可以使它更快,但它们可能不是必需的。

1000 万行是一个相对较小的数字。尽管如果行非常宽,情况可能会有所不同。对于性能问题,了解段大小通常比了解行数更好。硬件的段大小和知识将帮助您做出非常粗略的估计。例如,“表为 100GB,SAN 以 100MB/秒的速度单线程读取,因此仅扫描表需要 17 分钟......”。

--Find the segment size in gigabytes.
--No matter how many rows there are this may be the amount of I/O processed.
select sum(bytes)/1024/1024/1024 gb
from dba_segments
where segment_name = 'MYTABLE';

在这个简单的例子中,在我的 PC 上 5 秒内创建了 1000 万行。
--Create table.
drop table myTable;
create table myTable(id number, myColumn varchar2(100)) nologging;

--Insert 10 million rows. Takes 9 seconds on my PC.
begin
for i in 1 .. 100 loop
insert /*+ append */ into myTable
select level, null from dual connect by level <= 100000;
commit;
end loop;
end;
/

--Create index. Takes 5 seconds on my PC.
create index myTable_idx_myColumn on myTable(myColumn);

那么你的机器上发生了什么?要找出答案,首先您需要找到 CREATE INDEX ... 的 SQL_ID。陈述。在建立索引时,运行以下命令:
--Find the SQL_ID.
select sql_id, sql_text, elapsed_time/1000000 seconds
from v$sql
where users_executing > 0
order by seconds desc;

有很多方法可以从这里开始,我更喜欢 SQL 监控。如果语句正在运行或“最近”正在运行,则监控数据应该仍然存在。将 SQL_ID 插入此 SQL 语句以获取报告:
--Generate SQL Monitoring report.
--(This feature requires licensing, but if this is the first time you use it, it's
-- reasonable to consider this "testing". Buy it if you like it.)
select dbms_sqltune.report_sql_monitor('gb7tu2jpwng3q') from dual;

报告中有很多数据。理解需要一段时间,但通常它会包含解决此类问题所需的大部分内容。首先,查看 Activity (%) - 哪个步骤耗时最长?然后看看细节——它在等什么?看看Read和Write字节,它们对硬件来说合理吗?
SQL Monitoring Report

SQL Text
------------------------------
create index myTable_idx_myColumn on myTable(myColumn)

Global Information
------------------------------
Status : DONE
Instance ID : 1
Session : JHELLER (133:56633)
SQL ID : gb7tu2jpwng3q
SQL Execution ID : 16777216
Execution Started : 10/23/2015 00:34:32
First Refresh Time : 10/23/2015 00:34:36
Last Refresh Time : 10/23/2015 00:34:37
Duration : 5s
Module/Action : PL/SQL Developer/SQL Window - New
Service : orcl12
Program : plsqldev.exe

Global Stats
================================================================================================
| Elapsed | Cpu | IO | Application | PL/SQL | Buffer | Read | Read | Write | Write |
| Time(s) | Time(s) | Waits(s) | Waits(s) | Time(s) | Gets | Reqs | Bytes | Reqs | Bytes |
================================================================================================
| 4.72 | 2.67 | 1.84 | 0.21 | 0.00 | 15594 | 3904 | 312MB | 795 | 192MB |
================================================================================================

SQL Plan Monitoring Details (Plan Hash Value=564701026)
========================================================================================================================================================================================================
| Id | Operation | Name | Rows | Cost | Time | Start | Execs | Rows | Read | Read | Write | Write | Mem | Temp | Activity | Activity Detail |
| | | | (Estim) | | Active(s) | Active | | (Actual) | Reqs | Bytes | Reqs | Bytes | (Max) | (Max) | (%) | (# samples) |
========================================================================================================================================================================================================
| 0 | CREATE INDEX STATEMENT | | | | 2 | +4 | 1 | 1 | | | | | | | | |
| 1 | INDEX BUILD NON UNIQUE | MYTABLE_IDX_MYCOLUMN | | | 2 | +4 | 1 | 1 | | | | | | | 25.00 | Cpu (1) |
| 2 | SORT CREATE INDEX | | 100K | | 4 | +2 | 1 | 10M | 3656 | 192MB | 795 | 192MB | 75M | 202M | 75.00 | Cpu (2) |
| | | | | | | | | | | | | | | | | direct path write temp (1) |
| 3 | TABLE ACCESS FULL | MYTABLE | 100K | 46 | 1 | +4 | 1 | 10M | 248 | 120MB | | | | | | |
========================================================================================================================================================================================================

我希望你会看到一些“奇怪”的事件。也许某种表锁定,因为其他一些进程正在锁定表。

如果它只是一个巨大的表格并且需要数小时才能阅读它,那么并行性可能会有所帮助。这是使其工作的最简单方法。调整并行性可能很困难,但如果你很幸运并且一切都配置合理,只需添加关键字 parallel效果很好。
--Create index in parallel.
create index myTable_idx_myColumn on myTable(myColumn) parallel nologging;
--Reset it to NOPARALLEL after it's done.
alter index myTable_idx_myColumn noparallel;

关于oracle - 在 Oracle 中为大表的新列创建索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33288959/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com