Cloud SQL Postgres故障转移和CPU /内存升级过程中预期的不可用性？

Kannan Goundan 发表于 Dev

坎南冈丹

我对AWS RDS MySQL多可用区（HA）有一些经验。我正在寻找一个新项目的GCP Cloud SQL Postgres HA。

我正在尝试确定某些维护操作的工作方式，但无法从Cloud SQL文档中弄清楚。

故障转移会导致多少不可用性？
CPU /内存升级会导致多少不可用？
故障转移后，最终“故障回复”到原始主实例是否重要？还是可以让它无限期地在备用实例上运行？（Cloud SQL HA故障转移图使这两个实例看起来并不完全对称。）

仅供参考，AWS RDS的答案

故障转移：通常在不到70秒的不可用时间内，我的应用程序才能再次发出查询。

这用于计划的故障转移。（对于计划外的故障转移，RDS可能需要更长的时间才能检测到主实例在实际启动故障转移之前无响应。）
DNS可能会导致很多故障转移延迟。使用AWS RDS代理服务可能会减少时间（他们要求减少约80％）。该云SQL HA故障切换图显示两个实例共享一个虚拟IP，这可能意味着没有DNS的滞后呢？

CPU /内存升级：我认为AWS可以通过一次不值得的故障转移来完成此任务。它会升级备用实例（不可用），执行故障转移，然后再升级另一个实例。

在RDS上，我认为属于HA设置的两个实例是对称的。因此，如果您将故障转移到备用数据库，则可以采用这种方式。就RDS而言，没有必要将故障转移回到原始状态。

唐纳德·库沙罗（Donnald Cucharo）

要回答以下问题：

正如您提到的，不可用性的持续时间会有所不同，具体取决于它是计划的（手动）故障转移还是计划外的故障转移。最好进行测试并手动启动故障转移，以便可以看到实例对其进行响应的时间，通常需要一分钟左右的时间。当涉及到计划外的故障转移时，文档中几乎涵盖了发生故障转移时，与主实例和只读副本的所有现有连接都将关闭，并且重建连接大约需要2-3分钟。
要解决此问题，您需要了解实例的要求以允许故障转移：

主实例必须处于正常运行状态（未停止，正在进行维护或执行长时间运行的Cloud SQL实例操作，例如备份，导入或导出操作）。

这意味着故障升级在升级实例时不起作用，更改硬件规格（CPU /内存）将导致停机，因此您在进行这些更改时应提前计划。

要了解故障回复的重要性，以下是此链接的摘录：

高可用性解决方案将数据连续复制到远程站点或云。如果主系统发生故障，则可以启动远程辅助系统，并重新路由用户。此过程通常称为“故障转移”，它将停机时间减少到几秒钟或几分钟。

但是，故障转移不是永久状态。主服务器启动并运行后，必须还原数据和应用程序，以便可以恢复正常操作。此过程称为故障回复，从灾难恢复测试的角度来看，这一过程非常重要。原因如下：涉及故障回复时，并非所有复制技术都是平等创建的。在某些情况下，故障转移到生产服务器可能会非常缓慢。

更新1： Cloud SQL上的HA将为您的备用实例提供与主实例相似的规格，这就是为什么您要向非HA实例支付两倍价格的原因。同样，故障回复的重要性不仅限于任何云提供商。确保所有操作返回到主实例而不是仅将其保留在备用实例上只是一个好习惯。在这种情况下，必须进行故障恢复（具体来说是在Cloud SQL上），以确保中断后一切恢复正常。

更新2：如果不进行故障回复，则可能会发生以下情况：当备用实例运行所在的区域发生故障时（您无法控制备用实例来自哪个区域），您将无法进行故障转移，因为操作将被阻止。（请参阅文档）

不幸的是，几乎没有其他选择，因为每当您更换硬件时都需要停机。该过程将要求实例重新启动。这是查看所需时间的链接。

其他资源：https : //severalnines.com/database-blog/achieving-mysql-failover-failback-google-cloud-platform-gcp

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-26

我来说两句

0 条评论

登录后参与评论

上一篇：使用Python将单元格（使用JSON格式）中的数据拆分为单独的列

Cloud SQL Postgres故障转移和CPU /内存升级过程中预期的不可用性？

Cloud SQL Postgres故障转移和CPU /内存升级过程中预期的不可用性？

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用