google-cloud-sql - Cloud SQL Postgres 故障转移和 CPU/内存升级期间预期不可用？-6ren

google-cloud-sql - Cloud SQL Postgres 故障转移和 CPU/内存升级期间预期不可用？

转载作者：行者123 更新时间：2023-12-04 13:54:27

25

4

我对 AWS RDS MySQL 多可用区 (HA) 有一些经验。我正在寻找一个新项目的 GCP Cloud SQL Postgres HA。
我试图弄清楚某些维护操作是如何工作的，但无法从 Cloud SQL 文档中弄清楚。

故障转移会导致多少不可用？

CPU/内存升级会导致多少不可用？

故障转移后，最终“故障恢复”到原始主实例是否重要？或者我可以让它无限期地在备用实例上运行吗？ (Cloud SQL HA failover diagram 使两个实例看起来不完全对称。)

仅供引用，AWS RDS 的答案
故障转移:在我的应用程序能够再次发出查询之前，通常在 70 秒内不可用。

这适用于计划内的故障转移。 (对于计划外的故障转移，RDS 在实际启动故障转移之前检测到主实例没有响应可能需要更长的时间。)

很多故障转移延迟可能是由于 DNS。使用 AWS RDS 代理服务可能会减少该时间(他们声称减少了约 80%)。 Cloud SQL HA failover diagram显示两个实例共享一个虚拟 IP，这可能意味着没有 DNS 延迟？

CPU/内存升级:我认为 AWS 可以通过一次不可用的故障转移来实现这一点。它升级备用实例(无不可用)，执行故障转移，然后升级另一个实例。
在 RDS 上，我认为作为 HA 设置一部分的两个实例是对称的。因此，如果您故障转移到备用数据库，那么保持这种状态就好了。没有必要(就 RDS 而言)故障转移回原始状态。

最佳答案

回答您的以下问题:

正如您所提到的，不可用的持续时间会有所不同，具体取决于它是计划内(手动)故障转移还是计划外故障。最好测试并手动启动故障转移，以便您可以查看实例响应它的时间，通常需要一分钟左右。当谈到计划外故障转移时，文档中几乎涵盖了当发生故障转移时，与主实例和只读副本的任何现有连接都将关闭，重新建立连接大约需要 2-3 分钟。

要解决这个问题，您需要了解 requirements让您的实例允许故障转移:

The primary instance must be in a normal operating state (not stopped, undergoing maintenance, or performing a long-running Cloud SQL instance operation such as a backup, import or export operation).

这意味着升级实例时故障转移不计算在内，更改硬件规范(CPU/内存)将导致停机，因此您应该在进行这些更改时提前计划。

要了解故障恢复的重要性，这里是此 link 的摘录:

High availability solutions continuously replicate data to a remote site or cloud. In the event that a primary system goes down, the remote, secondary system can be spun up and users are rerouted. This process is commonly referred to as “failover,” and it reduces downtime to seconds or minutes.

However, failover isn’t a permanent state. Once primary servers are up and running, data and applications must be restored so normal operations can resume. This process is known as failback, and it is very important from a DR testing standpoint. Here’s why: Not all replication technology is created equally when it comes to failback. In some cases, failing back to production servers can be painfully slow.

更新 1:
Cloud SQL 上的 HA 将为您的备用实例配置与您的主实例类似的规范，这就是为什么您将获得非 HA 实例价格两倍的费用。此外，故障恢复的重要性不仅限于任何云提供商。确保所有操作都返回到您的主实例而不是仅将其留在备用实例上是一种很好的做法。在这种情况下，故障回复(具体是在 Cloud SQL 上)对于确保在中断后一切恢复正常是非常必要的。
更新 2:
如果您不进行故障回复，则可能发生的情况是，当运行备用实例的区域出现中断时(您无法控制 zone 备用实例来自什么)，您将无法执行故障转移，因为操作将被阻止。 (见文档)
不幸的是，几乎没有选择，因为每当您更换硬件时都需要停机。该过程将要求实例重新启动。这是查看 how long it would take的链接.
其他资源: https://severalnines.com/database-blog/achieving-mysql-failover-failback-google-cloud-platform-gcp

关于google-cloud-sql - Cloud SQL Postgres 故障转移和 CPU/内存升级期间预期不可用？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65115884/

25

4

0

文章推荐： reactjs - 基于通配符路由的 Esri-arcgis 请求拦截

文章推荐： typescript - 是否可以在 TypeScript 中使用 @truffle/contract？

文章推荐： vagrant - 如何通过名称而不是 id 使环境 Vagrant 停止

JavaScript 故障
有人可以解释一下为什么这个脚本不起作用吗？ function destroy(ID) { if (confirm("Deleting is a very bad thing! Sure?")
wcf - Silverlight 故障
我正在尝试使 WCF Silverlight 故障按此方式工作: MSDN aricle 将 SL 故障添加到我的 Web.config 文件后，我收到以下警告: The element 'behav
Haskell mod 故障？
这是我要删除的 Haskell 函数 2::Int和 5::Int从列表中: remPrimesFactors25 :: [Int] -> [Int] remPrimesFactors25 [] =
FFmpeg DTS 故障
当我想用 ffmpeg 连接和录制两个 mp4 视频时，我遇到了这个问题。我得到的输出是: [concat @ 0x2566e80] DTS 4079 #0:0 (h264 (native) ->
delphi - SetCursorPos 故障？
我想在delphi中编写一个程序来模拟以特定速度移动的鼠标指针(类似于AutoIT MouseMove函数)。要么是我的代码错误，要么是 SetCursorPos 在被调用太多次后出现故障。这是我的功
JavaScript 故障，无法正确重定向
我将“wa、or 和 id”(来自这些州的访问者)设置为重定向到 website1.com - 当我访问该网站时，它会将我重定向到 website1.com(因此它知道我在 WA) 。但如果我将 wa
WCF - 故障/异常与消息
我们目前正在争论通过 WCF channel 抛出错误与传递指示状态或服务响应的消息是否更好。故障带有 WCF 的内置支持，您可以使用内置的错误处理程序并做出相应的 react 。然而，这会带来开销
r - c() 故障？
不确定我在这里做错了什么，如果有任何帮助，我们将不胜感激。尝试创建一个名为“control”的新变量，并在行变量等于这些数字时将其编码为 1，否则编码为 0。 data$control= ifels
.net - 遥测采样而不影响错误/故障
我想在应用洞察中记录成功调用的百分比。我看到这篇文章https://learn.microsoft.com/en-us/azure/azure-monitor/app/sampling我认为固定速率采
python - 如何区分Python或Matlab是否错误/故障？
我正在尝试使用 SVD 和特征分解来使用动态模式分解进行一些数据分析。我遇到了一个简单的问题，即从 Matlab 和 Python 获得不同的结果。我很困惑，不知道为什么 Python 给我错误的结果
php - 我迫切需要帮助来排除mysqli_error()故障。
This question already has an answer here: mysqli_fetch_assoc() expects parameter / Call to a member
c - 结构链接表分段-故障
我刚刚开始我的一个实验室，在那里我计算类(class)的 GPA，其信息存储在结构的链接列表中。截至目前，我正在尝试打印所有类(class)信息，以确保它们已正确初始化并添加到链接列表中。我遇到了一
c++ - GetWindowText 故障
我正在尝试学习如何使用 visual studio 为 C++ 制作 GUI。但是我在使用 GetWindowText() 函数时遇到了一些问题。它不会将 LPTSTR 标题更改为文本框中的文本，并且
ios - NSNumberFormatter 故障
我有一个奇怪的问题。它似乎只出现在测试者的 iPhone 5s 上。它可以在运行最新 iOS (8.3) 的 iPhone 5、6 和 6 plus 上正常运行。这是代码 -(NSString *)
ios - 更新核心数据记录<故障>
我正在尝试更新 Core Data 中的一些记录。我正在采取以下步骤来完成它带谓词的获取函数从核心数据中检索记录将结果集存储在对象数组中遍历数组并更新每条记录调用保存上下文我遇到了两个问题
iphone - viewWithTag 故障。
我通过 Storyboard设计了 tableView，在一个单元格中我有一个按钮和一个标签。按钮在 Storyboard上有标签 1 和标签在 Storyboard上有标签 2。在 cellForR
ios - textFieldShouldEndEditing 故障？
我实现了这个方法，当在文本字段中输入了未经授权的字符或已使用的用户名时，向用户发送多个警报 View : func textFieldShouldEndEditing(textField: UITex
C++ Rnd() 故障
伙计们，我在运行程序时遇到了这个非常奇怪的错误。这是重要的代码: 变量(编辑): const short int maxX = 100; const short int maxZ = 100; con
JavaScript 错误/故障？
我有这个修改过的 Matrix Javascript 代码，我想摆脱第一次运行的所有与自身重叠的字符串。有人知道我该如何管理吗？另外，我想在我的网页上多次使用此代码，我需要声明新变量，不是吗？但是当我
c# - COMException 故障
有谁知道是否有网站(甚至非 Microsoft)有关于 COMExceptions/HRESULTS 的详细信息。当我尝试在使用 Copy() 函数后保存我的 Excel 工作簿时，我收到此错误:

首页

博学

6Ren·AI

商城

google-cloud-sql - Cloud SQL Postgres 故障转移和 CPU/内存升级期间预期不可用？