检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
批量RDS操作 批量RDS操作为用户提供了管理RDS实例的能力,支持进行批量开启、停止、重启等操作。 批量开启 批量停止 批量重启 父主题: 资源运维
混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心
自动化运维常见问题 审批人无法接收通知? 自定义脚本参数输入值无效? 实例无法选择? 如何在不重启实例的情况下重置密码? 父主题: 资源运维常见问题
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能发生的故障点进行
应急预案 操作场景 您可以对系统可能发生的故障建立对应的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 应急预案页面 单击“创建应急预案”,填写应急预案基本信息。
总览 提供用户创建运维事务,查看用户的资源健康、资源监控、安全、运维能力、系统公告等相关信息,为用户提供基于资源一站式的信息概览。 运维事务中心 快速配置中心 资源总览 资源监控 应用监控 安全概览 运维态势感知
应急预案参数说明 参数名 参数说明 应急预案名称 用户自定义此次演练的应急预案名 所属应用 演练目标主机或容器的所属应用 应急预案概述 描述应急预案主要信息 应急预案附件 针对演练异常情况的紧急恢复指导书 演练过程中可能出现不可预料的异常情况,用户须提前准备好应急措施,准备好紧急恢复指
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
可以根据自身的业务需求使用云运维中心提供的一系列常用实践。 表1 常用最佳实践 实践 描述 标准化故障管理 建立标准化的事件流程,实现规范性处理 全旅程混沌工程方案 对系统进行混沌演练,通过演练结果检验和提升系统的可用性 一站式资源运维 检查主机操作系统(OS)补丁的合规性情况,