检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
约束限制: 不涉及。 取值范围: 资源类型较多,根据实际业务选择资源类型、常用资源类型如下: cloudservers:弹性云服务器。 servers:裸金属服务器。 clusters:云容器引擎。 instances:云数据库。 默认取值: 不涉及。 limit 是 Integer
变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。 标准化流程:华为云标准故障处理流程服务化,通过WarRoom实现运维、研发等多兵种协同作战,响应预案提升故障处理效率。 运维知识库:基于历史故障和专家经验构筑运维知识库,实现已知故障快速恢复,未知故障沉淀经验。
支持启用/停用问题类别,并支持新增/删除/修改自定义问题类别(系统预置的暂不支持)。 问题审批 自定义配置问题挂起/级别调整场景的审批规则。 变更场景 变更场景 支持启用/停用变更场景和增删改/启停子节点;自定义变更场景支持新增/删除/修改,系统预置场景暂不支持删除/修改。 父主题: 流程管理
目标版本:请选择升级的目标版本。 图2 配置执行内容 设置“OS版本升级步骤”。 系统已预置了“升级前业务处理”、“升级前准备”、“升级前检查”、“升级前备份”、“OS升级”、“OS重启”、“睡眠”、“等待OS重启”、“升级后系统处理”、“升级后业务处理”和“升级后业务验证”11个步骤。 其中“
应急预案概述 云运维中心的韧性中心提供了应急预案功能,允许用户为系统可能发生的故障建立对应的应急预案。这样,在故障发生后,用户可以参考这些预案进行紧急恢复。创建应急预案的流程包括登录云运维中心,选择“韧性中心>应急预案”页面,并进行应急预案的自定义创建,包括填写基本信息、选择处理
方式只适于通知对象为工单责任人、排班、个人的情况。 单击“确定”。 完成自定义SLA创建。 仅自定义SLA支持创建,公共SLA会自动预置在系统里,仅对租户开启“启用”,“禁用”,“查看”功能。 创建或修改SLA后,将对新进入SLA流程的工单开始生效,对已处于SLA流程中的工单不会生效。
用于分页查询。 取值范围:上一次查询的最后一条记录ID。 默认值:不涉及。 region_id 否 String 区域。 约束:请参考统一身份认证服务选择存在的区域。 默认值:不涉及。 resource_id 否 String 资源ID,默认为空。 offset 否 Integer 用于分页查询,偏移指针。
根据命名规则,自定义基线的名称。 测试基线 基线类型 参数不支持修改,账号基线的类型。 组件基线 基线账号 账号类型 参数不支持修改,账号的操作系统类型。 仅支持Linux操作系统。 Linux 账号名称 请填写账号名称。 账号名称是资源的主机账号,后续账号改密等功能依赖填写的账号名称。 root 账号分级
问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急:造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。 严重:系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。
问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急:造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。 严重:系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。
"DIAyyyyMMddHHmmss123456789" } 状态码 状态码 描述 200 请求成功。 400 客户端错误。 500 服务端错误。 错误码 请参见错误码。 父主题: 故障诊断
仅“关联方式”选择“智能关联”时需要设置。 可选参数。请填写目标实例的标签值。 testValue 关联APM环境 可选参数。配置本分组所对应的APM服务中的应用-组件-环境,故障诊断时可获取APM服务相关性能信息。 - 单击“创建”,完成应用创建。 当用户的资源结构较为简单,如一个应用只涉及到华为云资源,且仅需要
默认取值: 不涉及 响应参数 状态码:200 表4 响应Body参数 参数 参数类型 描述 provider_code String 参数解释: 服务标识。 取值范围: 不涉及 默认取值: 049 error_code String 参数解释: 请求响应代码。 取值范围: GOM.00000000~GOM
响应示例 状态码:200 请求成功。 { "data" : "ST****" } 状态码 状态码 描述 200 请求成功。 400 服务器未能处理请求。 错误码 请参见错误码。 父主题: 定时运维
事件审批 操作场景 系统提供的事件暂停和事件降级默认流程,支持用户自定义事件暂停和降级审批流程,流程修改后可在事件处理页面发起申请和审批。 事件降级和暂停审批流程配置生效后创建的事件单流程才会生效,配置流程之前不会生效。 事件在已受理状态可进行升降级和暂停操作。 事件闭环之前需要将升降级和暂停的电子流闭环。
操作场景 公共脚本是云运维中心提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘、重置密码、启动或关闭操作系统等。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。 约束与限制 单任务最多支持选择999台实例。 执行公共脚本 登录云运维中心。
查看原始告警 操作场景 原始告警是由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚
minor:次要。 warn:提示。 默认取值: 不涉及 come_from String 参数解释: 告警来源,告警来源可从集成管理获取,取值为各个云服务名称。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 transfer_rule String 参数解释: 流转规则ID,流
状态码:400 服务器未能处理请求。 更多状态码请参考状态码。 { "error_code" : "COC.00040701", "error_msg" : "error_msg" } 状态码 状态码 描述 200 脚本uuid。 更多状态码请参考状态码。 400 服务器未能处理请求。
创建并管理自定义预案 操作场景 如果云运维中心提供的公共预案不满足您的要求,可以对系统可能发生的故障创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录云运维中心。 在左侧菜单栏选择“韧性中心 > 应急预案”。 在“自定义预案”页签,单击右上方“创建应急预案”。