检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自定义预案 操作场景 您可以对系统可能发生的故障创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。
操作系统使用限制。
图3 查看SLA详情 系统做了租户隔离,仅能查看当前租户账号及其子账号创建的自定义SLA。 创建自定义SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”,进入“SLA管理”页面。 选择“自定义SLA”页签,进入自定义SLA列表界面。
本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。
图5 启动演练 在“演练详情”页面可以查看攻击进度,包括安装探针、执行演练、清理环境三个步骤,系统会自动执行。执行时间视武器的攻击时间而定。 安装探针步骤会在目标机器上部署一个探针,该探针将会运行在系统中用于接收攻击、查询和清除等步骤的武器命令。
在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件类别,当前页面显示的为系统预置的事件类别,不支持编辑和删除。 图1 事件类别 若不使用系统预置的事件类别,可将是否开启列表中开关关闭。若需要新增事件类别,单击“新增事件类别”,添加事件类别信息。
系统会将事件单的基本信息自动填充至复盘信息中,如故障现象,故障处理过程、故障原因等,并支持编辑。 单击右上方“编辑报告”。 设置“故障信息”。 表1 故障信息参数说明 参数 说明 报告标题 自定义故障报告的标题。 报告责任人 在下拉列表选择故障报告责任人。
事件级别 操作场景 系统提供的事件级别名称描述和业务流程定义的事件级别和描述不符合,支持用户自定义事件级别和描述。修改后会在创建事件单页面显示最新定义的级别。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件级别。
修改分组 操作场景 分组创建后,若想对分组的参数进行修改,请按如下操作进行。 修改分组 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择分组,单击。 设置“编辑分组”。 表1 修改分组参数说明 参数 说明 示例
创建分组 操作场景 创建组件后,若想在组件下创建分组,请按如下操作进行。 创建分组 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择组件,单击。 设置“创建分组”。 表1 创建分组参数说明 参数 说明 示例
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
如表4 COC系统策略所示,包括了COC基于策略授权中的所有系统策略。策略授权的系统策略与角色授权的系统策略并不互通。 表4 COC系统策略 系统策略名称 描述 策略类别 COCReadOnlyPolicy 云运维中心服务只读权限。
操作系统 目标实例的操作系统类型,当前支持Linux和Windows。 请根据目标实例的操作系统类型进行选择。 执行用户 命令的执行用户。 Windows系统ECS:默认为system,不支持修改。 Linux系统ECS:默认为root,支持手动输入其他用户作为执行用户。
创建应用 操作场景 应用是根据业务需要,对相同或者相近业务的一组组件进行逻辑划分。创建应用后,即可为该应用添加子应用、组件等信息。 注意事项 应用结构类型选择大型应用时支持配置子应用。 应用或子应用下同级节点不能同时存在子应用和组件。 创建应用 登录云运维中心。 在左侧导航栏选择“
成长地图 | 华为云 云运维中心 云运维中心(Cloud Operations Center)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供故障管理、批量运维、混沌演练等核心特性,实现在安全合规的前提下,云上运维效率提升。 产品介绍
应用场景 运维态势感知BI 面向不同角色运维人员的专属运维BI看板,辅助运维优化改进和洞察决策。 指标项丰富:预置接入30个+运维指标,构建7张运维态势感知大屏,从宏观到微观全面呈现运维全局态势,提供企业级运维沙盘。 图1 运维沙盘 资源全生命周期管理 提供资源定义、申请、发放、运维
紧急: 造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。 严重: 系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。
批量FlexusL操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源批量操作
批量ECS操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 父主题: 资源批量操作
应用管理 概述 创建应用 修改应用 删除应用 应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 查看资源详情 查看容量详情 父主题: 资源管理