Bru*_*ceM 5 google-compute-engine google-cloud-platform
每次我的 Compute Engine VM 重新启动时,我都希望收到一封电子邮件(或其他形式的通知),这样我就可以连接并看到一切都已正确启动(并对我的实例的可靠性产生总体感觉)
我查看了 Google Cloud Console 中的所有选项,但没有找到任何东西......
如果您还没有,请阅读实时迁移文档以了解实时迁移的一般工作原理。
Google 提供了设置实例可用性策略的控件,这也让您可以控制实时迁移的各个方面。在这里,他们还提到了要查找的内容以确定何时进行实时迁移。
默认情况下,标准实例设置为实时迁移,其中 Google Compute Engine 会自动将您的实例从基础架构维护事件中迁移出来,并且您的实例在迁移期间保持运行。您的实例可能会在短时间内出现性能下降,但通常大多数实例不会注意到任何差异。这对于需要持续正常运行时间并且可以容忍短期性能下降的实例来说是理想的。
当 Google Compute Engine 迁移您的实例时,它会报告发布到区域操作列表的系统事件。您可以通过执行
gcloud compute operations list --zones ZONE
请求或查看 Google Cloud Platform Console 中的操作列表,或通过 API 请求来查看此事件。该事件将显示以下文本:Run Code Online (Sandbox Code Playgroud)compute.instances.migrateOnHostMaintenance
此外,当维护事件即将发生时,您可以直接在 VM 上进行检测。
元数据服务器通过调度/目录和维护事件属性提供有关实例调度选项和设置的信息 。您可以使用这些属性来了解虚拟机实例的调度选项,并使用此元数据在维护事件即将发生时通过
maintenance-event
属性。默认情况下,所有虚拟机实例都设置为实时迁移,因此元数据服务器将在 VM 实例实时迁移之前收到维护事件通知。如果您选择在维护期间终止虚拟机实例,那么如果设置了 automaticRestart 属性,Compute Engine 将自动终止并有选择地重新启动您的虚拟机实例。要了解有关事件期间维护事件和实例行为的更多信息,请阅读调度选项和设置。您可以通过
maintenance-event
定期查询属性来了解何时会发生维护事件 。此属性的值将在维护事件开始前 60 秒更改,使您的应用程序代码可以在维护事件之前触发您想要执行的任何任务,例如备份数据或更新日志。Compute Engine 还提供了一个示例 Python 脚本 来演示如何检查维护事件通知。您可以使用带有等待更新功能的维护事件属性来在维护事件即将开始和结束时通知您的脚本和应用程序。这使您可以自动执行您可能希望在事件之前或之后运行的任何操作。以下 Python 示例提供了如何一起实现这两个功能的示例。
如果您想禁用实时迁移,您可以选择在发生维护事件时终止并可选地重新启动您的实例。
如果您不希望您的实例实时迁移,您可以选择终止并有选择地重新启动您的实例。使用此选项,Google Compute Engine 将通知您的实例关闭,等待一小段时间让您的实例完全关闭,终止实例,并在远离维护事件的情况下重新启动它。此选项非常适合需要恒定、最高性能的实例,并且您的整体应用程序旨在处理实例故障或重启。
查看设置可用性策略部分,了解有关如何配置的更多详细信息。
如果您使用带有 GPU 的实例或抢占式实例,请注意不支持实时迁移:
无法实时迁移连接了 GPU 的实例。它们必须设置为终止并可选择重新启动。Compute Engine 会在连接了 GPU 的虚拟机实例终止之前提供 60 分钟的通知。要了解有关这些维护事件通知的更多信息,请阅读获取实时迁移通知。
要了解有关使用 GPU 处理主机维护的更多信息,请阅读 GPU 文档中的处理主机维护。
您无法将抢占式实例配置为实时迁移。
TERMINATE
默认情况下,抢占式实例的维护行为始终设置为 ,并且您无法更改此选项。也无法为抢占式实例设置自动重启选项。注意:对于具有 GPU 的实例,属性会在实例终止前 60 分钟更改,以便您有时间在另一台主机上关闭并重新启动。具有 GPU 的实例不会实时迁移,而是会终止并有选择地重新启动。要了解更多信息,请阅读 GPU 文档中的处理主机维护。
归档时间: |
|
查看次数: |
8138 次 |
最近记录: |