检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
包年/包月计费模式,场景化作业和OS版本变更采用按需计费模式。 COC与其他云服务组合使用,例如为您提供发送通知等增值服务,这些增值服务可能产生额外费用,具体以对应云服务的收费为准,由提供该功能的服务结算。 计费模式 COC的云运维平台-专业版、多云纳管和优化、故障管理、变更管理
业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。 华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的 IaaS、PaaS 和 SaaS 类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务
选择需要同步的资源类型。 默认选择“弹性云服务器ECS”。 选择目标实例,单击实例名称,进入查看详情页面。 支持查看资源名称,ID、企业项目、区域、云服务器信息、所属的应用、分组和组件等信息,同时支持跳转到对应的分组界面。 单击下方的“查看资源详情”。 进入对应资源服务详情页面。 父主题: 资源管理
管理跨账号资源 操作场景 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力。当您的账号是企业级账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,您可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力
各种挑战做好准备。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。 创建自定义故障
帮您快速了解服务器整体运行状况并准确提供异常问题排查定位的方法。 注意事项 ECS诊断目标实例的UniAgent状态需要为运行中,UniAgent相关操作请参考配置UniAgent。 ECS诊断插件仅支持部分操作系统,详情请见下表: 表1 ECS诊断插件支持的操作系统 机器架构 操作系统(OS)类型
实际需求进行选择。COC支持的系统策略,请参见基于策略授权模型。若您需要对除COC之外的其它服务授权,IAM支持服务的所有权限请参见系统权限。 示例流程 图1 给用户授予COC权限流程 创建用户或创建用户组 在IAM控制台创建用户或用户组。 将系统策略附加至用户或用户组 为用户或
它从用户的角度对服务的某个特定方面进行量化的衡量。例如,对于一个网站服务,常见的SLI可能包括页面加载时间、请求成功率、请求时延和流量等。如果有任意一个指标超出正常范围,那么则判定该系统无法提供服务,随着系统无法提供服务的时间增加,系统的SLO值随之减小。 服务等级协议(Service
变更 变更管理 统计变更单的数量趋势 选择时间周期内,所有变更单的数量 天/月 个 服务SLO SLO管理 统计服务SLO实际值的变化趋势 SLO实际值 = 1 - (服务不可用时长 / 云服务总时长)*100% 天/月 百分比 风险冒泡 变更导致故障数 事件管理 统计变更问题引发事件单数量
概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在云运维中心COC中,WarRoom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会
coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。 coc:instance:changeOS 授予切换弹性云服务器操作系统的权限。 coc:instance:start 授予启动云服务器的权限。 coc:instance:reboot 授予重启云服务器的权限。 coc:instance:stop
密钥管理 操作场景 为了更加安全地保护您的主机账号密码,云运维中心会使用DEW服务来加密您的主机账号密码。在使用密钥管理之前,请先在DEW创建好密钥。 配置密钥 登录云运维中心。 在左侧导航栏选择“资源运维 > 自动化运维”。 在“日常运维”模块单击“账号管理”。 单击右上方“密钥管理”。
单击“确认”,完成Config服务开通。 AK/SK所对应的账号需添加Action。 创建策略:进入“IAM”服务,选择“策略”,单击“创建策略”,选择服务“EC2”,筛选操作并勾上“DescribeRegions”,单击“添加更多权限”,选择服务“Config”,筛选操作并勾上
String 服务标识。 error_code String 请求响应代码,范围:0000~9999,正常时取值:0。 error_msg String 请求响应描述。 状态码:400 表4 响应Body参数 参数 参数类型 描述 provider_code String 服务标识。 error_code
安装探针、执行演练、清理环境三个步骤,系统会自动执行。执行时间视武器的攻击时间而定。 安装探针步骤会在目标机器上部署一个探针,该探针将会运行在系统中用于接收攻击、查询和清除等步骤的武器命令。在演练结束或终止操作后,清理环境步骤将停止其在系统中的所有操作并移除。 对于演练执行,支持以下操作:
server error. 服务内部错误。 请联系客服。 500 COC.00010009 Param can not be empty. 参数不能为空。 请填写参数。 500 COC.00012001 Internal server error. 服务内部错误。 请联系客服。 500
资源监控 操作场景 您可以在资源监控快速查看账号下购买资源(例如弹性云服务器、对象存储、云数据库等)的监控指标信息,如ECS的CPU使用率、磁盘读/写带宽,对象存储的存储对象总数、TPS等。 资源监控 登录云运维中心。 进入COC“总览”,查看资源监控,展示CES监控的指标信息。
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
执行对象:目标实例,由客户自行选择。 定时运维使用限制 单个租户最多支持创建100个定时任务。 目标实例当前支持弹性云服务器(ECS),裸金属服务器(BMS)、Flexus应用服务器L实例(FlexusL)类型。 定时运维任务“状态”列为“正常”(免审批或已审批入库的)、“是否启用”列为“开启”才会自动执行脚本/作业。
通过不间断读写文件,对磁盘IO加压,支持故障紧急终止 主机进程 进程号耗尽 耗尽系统进程号(PID),不支持故障紧急终止 杀进程 故障持续期间重复杀进程,支持故障紧急终止;紧急终止或演练结束后演练系统不负责拉起进程,服务需自行保证进程恢复正常 主机网络 网络延迟 模拟网络故障导致链路延迟增大,支持故障紧急终止