gpt4 book ai didi

sql-server - 同一服务器上的 Azure SQL 数据库会相互影响性能

转载 作者:行者123 更新时间:2023-12-05 04:05:07 24 4
gpt4 key购买 nike

我们的 Web 应用程序的不同环境(例如生产、登台)对应的数据库位于同一 Azure SQL 数据库服务器上。当我到处阅读that an Azure SQL server is just a logical container (并且其上的数据库甚至可能不在同一台物理机器上)我们看到数据库表现为嘈杂邻居的迹象,即对其中一个数据库进行的操作会影响其他数据库的性能。

我们已经看到以下操作和指标在数据库之间发生关联。我们将一个数据库称为“产品”,另一个称为“阶段”;在所有情况下,阶段都是通过使用 Start-AzureWebAppSqlDatabaseCopy PowerShell commandlet 复制 prod 创建的。

  • 扩展阶段与产品上的数据 IO 峰值相关。
  • 在舞台上运行性能要求较高的操作(删除数千个表,更新大约 10,000 行)与 SQL 连接超时(“操作完成之前超时时间已过,或者服务器没有响应。”)和数据相关产品上的 IO 峰值。

对于这两个数据库,我们使用单独的数据库级用户帐户(有关原因,请参阅 this SO post ),但是 prod 和 stage 用户帐户都存在于两个数据库下(即我们使用 stage 用户连接到 stage DB,但stage用户也存在于prod DB下,prod用户也存在于stage DB下)。我们从产品数据库中删除了 stage 用户,看看这是否会产生影响,但事实并非如此。

值得注意的是,当 Web/业务 Azure SQL 层逐步淘汰时,这些数据库已从 Web 迁移到当前的 S1 层。我们在另一台服务器上的数据库也看到了同样的问题。数据库不是弹性池的一部分。

我们的研究结果尚无定论,这些事件也并非 100% 相关。我们不知道要调查什么,因为我们确信阶段应用程序没有连接到产品数据库。我们试图找到阶段应用程序以某种方式影响产品数据库的证据,但我们找不到。任何意见将不胜感激。

更新1

使用 Grant 的 sys.dm_os_wait_stats 提示以及 sys.dm_os_performance_counters 可以明显看出,是的,如果您在同一台逻辑服务器上创建数据库的副本也将在同一物理 SQL Server 上创建。 object_name 中的服务器名称相同,等待值完全相同。

但这并不能解释为什么副本上的操作会影响原始数据库。由于噪声邻居效应似乎不会一直发生(大多数情况下扩展确实会影响原始数据库,性能密集型操作较少,但相关性仍然明显),它可能是一些随机的 Azure问题。

我们将看看使用不同的逻辑服务器是否可以解决该问题。可以肯定的是,在这种情况下,物理服务器也会有所不同,我们已经检查过了。

更新2

我们正在监控情况,但这是否确实解决了问题很可能要在几个月后才会显现出来。目前我们已将所有数据库放在单独的服务器上。

我们确实注意到,在 stage DB 上的所有操作完成后,prod DB 总是在相同的时间间隔内发生超时。然而,这些超时似乎只发生在表创建时。就像将生产数据库复制到阶段数据库后,生产数据库在一段时间内(大约 45-60 分钟)有些“锁定”,并且您无法创建表(但您可以删除它们,这些工作)。有趣的是,今天并没有发生这种情况,所以也许它已经自行解决了......

最佳答案

根据您提供的信息,我怀疑问题是您的数据库工作负载偶尔是 I/O 密集型,正在达到层限制并且 Azure SQL 开始受到限制。这种限制可能是这些超时背后的原因。

请使用以下查询监控资源消耗:

SELECT 
(COUNT(end_time) - SUM(CASE WHEN avg_cpu_percent > 80 THEN 1 ELSE 0 END) * 1.0) / COUNT(end_time) AS 'CPU Fit Percent'
,(COUNT(end_time) - SUM(CASE WHEN avg_log_write_percent > 80 THEN 1 ELSE 0 END) * 1.0) / COUNT(end_time) AS 'Log Write Fit Percent'
,(COUNT(end_time) - SUM(CASE WHEN avg_data_io_percent > 80 THEN 1 ELSE 0 END) * 1.0) / COUNT(end_time) AS 'Physical Data Read Fit Percent'
FROM sys.dm_db_resource_stats

服务级别目标 (SLO) 为 99.9% <= 进入下一层。

测量一段时间内的 DTU 消耗。当以下查询显示 DTU 使用率很高时,您是否遇到超时。

SELECT start_time, end_time,   
(SELECT Max(v) FROM (VALUES (avg_cpu_percent), (avg_data_io_percent),
(avg_log_write_percent)) AS value(v)) as [avg_DTU_percent]
FROM sys.resource_stats where database_name = 'AdventureWorksLT' order by end_time desc

比较 DTU 使用情况与 DTU 限制。

SELECT 
end_time AS [EndTime]
, (SELECT Max(v) FROM (VALUES (avg_cpu_percent), (avg_data_io_percent), (avg_log_write_percent)) AS value(v)) AS [AvgDTU_Percent]
, ((dtu_limit)*((SELECT Max(v) FROM (VALUES (avg_cpu_percent), (avg_data_io_percent), (avg_log_write_percent)) AS value(v))/100.00)) AS [AvgDTUsUsed]
, dtu_limit AS [DTULimit]
FROM sys.dm_db_resource_stats

关于sql-server - 同一服务器上的 Azure SQL 数据库会相互影响性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51603021/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com