检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。
批量启动云服务器 ecs:cloudServers:start 资源运维中批量启动云服务器 切换弹性云服务器操作系统 ecs:cloudServers:changeOS 资源运维中批量切换云服务器的操作系统 重装弹性云服务器操作系统 ecs:cloudServers:rebuild
总览 提供用户创建运维事务,查看用户的资源健康、资源监控、安全、运维能力、系统公告等相关信息,为用户提供基于资源一站式的信息概览。 运维事务中心 快速配置中心 资源总览 资源监控 应用监控 安全概览 运维态势感知
资源管理 安装UniAgent支持操作系统 目前支持的Linux操作系统版本有: EulerOS 2.2 64bit for Tenant 20210227 EulerOS 2.3 64bit EulerOS 2.5 64bit for Tenant 20210229 CentOS
云运维中心为您提供资源运维和自动化运维相关接口 表1 接口说明 接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至
支持的授权项 策略包含系统策略和自定义策略,如果系统策略不满足授权要求,管理员可以创建自定义策略,并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下: 权限:允许或拒绝对指定资源在特定条件下进行某项操作。
一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。
集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。 若事件生成后,想要接收到事件的通知信息,可配置自动通知能力,具体参考通知管理。 父主题: 故障管理常见问题
对已添加的用户在编辑时,若填写了手机号、邮箱、企业微信、钉钉、飞书等通讯方式,系统后台会为其创建对应的订阅方式,以便于满足后续消息通知的需要。 在人员管理页面可通过用户信息字段颜色区分当前是否存在订阅,灰色:用户未订阅或订阅但未确认订阅;黑色:用户已订阅且已确认订阅。
系统默认事件降级无需审批,无事件暂停能力 图1 事件流程 单击“新建事件流程”配置事件降级或事件暂停的流程,选择事件流程、事件级别和审批配置。 图2 新建事件流程 配置完成后在事件处理页面进行事件降级需要审批,同时支持事件暂停。
图2 创建事件单 事件等级定义如下: P1:核心业务功能不可用,影响所有客户 P2:核心业务功能受损,影响部分客户,客户核心业务受影响 P3:非核心业务功能异常报错,影响部分客户业务 P4:非核心业务功能异常报障,业务时延增大、性能下降,客户体验下降 P5:非系统业务异常,属于客户咨询
针对未绑定组件的主机,系统默认通过内置的全局基线来纳管主机帐号。用户也可通过“创建帐号基线”方式(推荐)来自定义需要纳管的主机帐号,前提是主机已绑定组件(未绑定的主机可先在CMDB侧先创建应用再创建组件)。
enterprise_project_id 否 String 企业项目id name 否 String 名称 instance_id 否 String ECS实例id ip 否 String 内网ip eip 否 String 弹性公网ip operating_system 否 String 操作系统
图3 填写补丁基线内容 操作系统安装规则见表1。
华为云租户的安全责任在于对使用的 IaaS、PaaS 和 SaaS 类云服务内部的安全以及对租户定制配置进行安全有效的管理,包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统,虚拟防火墙、API 网关和高级安全服务,各项云服务,租户数据,以及身份账号和密钥管理等方面的安全配置。
注意事项 若出现实例不可选,请排查以下三种情况: 该实例UniAgent状态是否正常 是否为Cloud Operations Center补丁管理支持操作系统 该实例是否处于关机状态 操作步骤 登录COC。
支持时间轴自动刷新,当勾选“自动刷新”后,“结束时间”根据刷新频率自动刷新到系统最新当前。 图2 故障时间范围选择 应用拓扑大屏默认显示当前应用下的所有子应用。
Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头中,从而通过身份认证,获得操作API的权限。Token可通过调用获取用户Token接口获取。
API方式 如果用户需要将云服务平台上的云运维中心集成到第三方系统,用于二次开发,请使用API方式访问云运维中心,具体操作请参见《云运维中心API参考》。 控制台方式 其他相关操作,请使用管理控制台方式访问云运维中心。
执行该定时任务的委托权限 说明: 若选择的任务是公共作业下的ECS开机、ECS关机、ECS重启、OS补丁扫描或OS补丁修复,系统执行时默认使用名为ServiceAgencyForCOC的委托。 风险等级 必选参数。