检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。 标准化流程:华为云标准故障处理流程服务化,通过WarRoom实现运维、研发等多兵种协同作战,响应预案提升故障处理效率。 运维知识库:基于历史故障和专家经验构筑运维知识库,实现已知故障快速恢复,未知故障沉淀经验。
原始告警 操作场景 原始告警是由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。
事件审批 操作场景 系统提供的事件暂停和事件降级默认流程,支持用户自定义事件暂停和降级审批流程,流程修改后可在事件处理页面发起申请和审批。 事件降级和暂停审批流程配置生效后创建的事件单流程才会生效,配置流程之前不会生效。 事件在已受理状态可进行升降级和暂停操作。 事件闭环之前需要将升降级和暂停的电子流闭环。
自定义预案 操作场景 如果云运维中心提供的公共预案不满足您的要求,可以对系统可能发生的故障创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录云运维中心。 在左侧菜单栏选择“韧性中心 > 应急预案”。 在“自定义预案”页签,单击右上方“创建应急预案”。
状态码:400 服务器未能处理请求。 更多状态码请参考状态码。 { "error_code" : "COC.00040701", "error_msg" : "error_msg" } 状态码 状态码 描述 200 脚本uuid。 更多状态码请参考状态码。 400 服务器未能处理请求。
操作场景 公共脚本是云运维中心提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘、重置密码、启动或关闭操作系统等。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。 执行公共脚本 登录云运维中心。 在左侧导航栏选择“资源运维 > 自动化运维”。
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量开机 登录云运维中心。 在左侧导航栏选择“资源运维 > 资源批量操作”。 选择“裸金属服务器BMS > 开机”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。 手
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重启 登录云运维中心。 在左侧导航栏选择“资源运维 > 资源批量操作”。 选择“弹性云服务器ECS > 重启”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。 手
启工单,则无法执行。 批量重启 登录云运维中心。 在左侧导航栏选择“资源运维 > 资源批量操作”,进入“资源批量操作”页面。 选择“裸金属服务器BMS > 重启”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。 手
启工单,则无法执行。 批量关机 登录云运维中心。 在左侧导航栏选择“资源运维 > 资源批量操作”,进入“资源批量操作”页面。 选择“裸金属服务器BMS > 关机”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。 手
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量关机 登录云运维中心。 在左侧导航栏选择“资源运维 > 资源批量操作”。 选择“Flexus应用服务器L实例 > 关机”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。 手
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量关机 登录云运维中心。 在左侧导航栏选择“资源运维 > 资源批量操作”。 选择“弹性云服务器ECS > 关机”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。 手
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重启 登录云运维中心。 在左侧导航栏选择“资源运维 > 资源批量操作”。 选择“Flexus应用服务器L实例 > 重启”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。 手
无法执行。 批量开机 登录云运维中心。 在左侧导航栏选择“资源运维 > 资源批量操作”,进入“资源批量操作”页面。 选择“Flexus应用服务器L实例 > 开机”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。 手
若有其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量开机 登录云运维中心。 在左侧导航栏选择“资源运维 > 资源批量操作”。 资源类型选择“弹性云服务器ECS > 开机”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。 手
详情页展示应用故障详情。 (可选)勾选“自动刷新”,自动刷新下拉列表选择刷新频率。 勾选“自动刷新”后,“结束时间”按照刷新频率自动刷新到系统当前时间。 (可选)若应用有子应用,单击子应用。 应用拓扑大屏展示该子应用下的所有组件,右侧详情页展示子应用故障详情。支持在拓扑大屏切换查看其它子应用。
源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
”页签。 单击“创建补丁基线”。 图2 单击创建补丁基线 填写补丁基线相关内容。 图3 填写补丁基线内容 操作系统安装规则见表1。 自定义安装规则见表2。 表1 操作系统安装规则 类型 可选项 说明 产品 全部 Huawei Cloud EulerOS1.1 Huawei Cloud
1751013322325, "status" : "finish" } 状态码 状态码 描述 200 请求成功。 400 客户端错误。 500 服务端错误。 错误码 请参见错误码。 父主题: 故障诊断
闭”状态前,若又满足流转规则不再会产生事件---该规则是默认启用的,支持关闭该规则。 流转规则生成汇聚告警,在窗口期内若没有收到原始告警,系统会将之前窗口期内的告警作为历史告警(即当前告警状态默认设置为“已处理”)。 图1 流转规则转事件/告警示意图 创建规则 登录云运维中心。 在左侧导航栏选择“故障管理