检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
事件级别 操作场景 系统提供的事件级别名称描述和业务流程定义的事件级别和描述不符合,支持用户自定义事件级别和描述。修改后会在创建事件单页面显示最新定义的级别。 修改事件级别 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 事件级别”。 选择需要修改的事件级别,单击操作列“修改”。
参数说明见表2 选择实例参数说明。 操作系统 目标实例的操作系统类型,当前支持Linux和Windows。 请根据目标实例的操作系统类型进行选择。 执行用户 命令的执行用户。 Windows系统ECS:默认为system,不支持修改。 Linux系统ECS:默认为root,支持手动输入其他用户作为执行用户。
"properties" : { "risk_level" : "HIGH", "version" : "1.0.0", "reviewers" : [ { "reviewer_name" : "test", "reviewer_id"
常用最佳实践 实践 描述 标准化故障管理 建立标准化的事件流程,实现规范性处理 全旅程混沌工程方案 对系统进行混沌演练,通过演练结果检验和提升系统的可用性 一站式资源运维 检查主机操作系统(OS)补丁的合规性情况,避免主机因为OS补丁缺失产生漏洞,导致业务受损
问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急:造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。 严重:系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。
批量FlexusL操作 批量开机FlexusL 批量关机FlexusL 批量重启FlexusL 批量重装FlexusL操作系统 批量切换FlexusL操作系统 父主题: 资源批量操作
批量ECS操作 批量开机ECS 批量关机ECS 批量重启ECS 批量重装ECS操作系统 批量切换ECS操作系统 批量执行ECS命令 批量诊断ECS 父主题: 资源批量操作
高危检测机制:在脚本投入使用前,系统会对脚本内容进行全面扫描,精准识别其中可能存在的删除关键文件、修改核心配置、越权访问等高危操作,并及时向用户发出预警,同时提供风险点的具体位置和修改建议。这一机制从源头阻断了危险脚本的执行路径,显著降低了因脚本错误或恶意代码导致的系统崩溃、数据丢失等安全隐患。
故障模式与演练任务是混沌演练体系中紧密衔接、层层递进的核心环节,二者构成 “风险前置识别” 与 “实现化验证” 的闭环关系: 故障模式聚焦于云应用的风险研判,通过系统性评估应用架构、依赖关系及潜在薄弱点,精准识别可能引发服务异常的风险场景(如节点宕机、网络延迟、资源耗尽等),是混沌演练开展的核心前提与依据。
支持启用/停用问题类别,并支持新增/删除/修改自定义问题类别(系统预置的暂不支持)。 问题审批 自定义配置问题挂起/级别调整场景的审批规则。 变更场景 变更场景 支持启用/停用变更场景和增删改/启停子节点;自定义变更场景支持新增/删除/修改,系统预置场景暂不支持删除/修改。 父主题: 流程管理
支持多维度验证(如风险覆盖度、流程合理性),提升演练实战价值。 灵活性与扩展性 自定义场景功能满足差异化需求。 支持与现有系统(如应急管理平台、培训系统)对接,实现数据互通。 知识沉淀 场景库积累了企业专属的最佳实践,形成组织级知识资产。 版本管理功能助力经验传承和持续优化。 典型应用场景
方式只适于通知对象为工单责任人、排班、个人的情况。 单击“确定”。 完成自定义SLA创建。 仅自定义SLA支持创建,公共SLA会自动预置在系统里,仅对租户开启“启用”,“禁用”,“查看”功能。 创建或修改SLA后,将对新进入SLA流程的工单开始生效,对已处于SLA流程中的工单不会生效。
管理和定期更改主机账号的密码,从而提高工作效率,减少人为错误,确保系统的安全性。 约束与限制 对于RDS for Mysql和GaussDB,仅要求纳管账号在主机上真实存在且具备登录权限。 ECS(Linux系统)主机的特定账号能被成功纳管,需要满足以下三个前提条件: 安装不低于1
问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急:造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。 严重:系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。
问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急:造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。 严重:系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。
操作场景 公共脚本是云运维中心提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘、重置密码、启动或关闭操作系统等。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。 单任务最多支持选择999台实例。 执行公共脚本 登录云运维中心。 在左侧导航栏选择“资源运维
查看原始告警 操作场景 原始告警是由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚
支持企业项目鉴权的操作 操作 描述 coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。 coc:instance:changeOS 授予切换弹性云服务器操作系统的权限。 coc:instance:start 授予启动云服务器的权限。 coc:instance:reboot
练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 故障模式聚焦于云应用的风险研判,通过系统性评估应用架构、依赖关系及潜在薄弱点,精准识别可能引发服务异常的风险场景(如节点宕机、网络延迟、资源耗尽等),是混沌演练开展的核心前提与依据。
在日常运维工作中,运维人员需要频繁地处理各种运维待办事项,如事件单、汇聚告警和待办任务,同时还需要对账号下已纳管的应用和资源进行统计分析。然而,这些任务往往分散在不同的系统中,导致运维效率低下。如何提高运维效率,简化运维流程?通过云运维中心,运维人员可以集中查询、跟踪运维待办事项(事件单/汇聚告警/待办),并