检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
在添加监控视图页面下方配置指标。 监控指标:左侧下拉菜单选择“弹性云服务器 - 云服务器”,右侧下拉菜单选择“云服务器 > 带外网络流出速率”。 监控范围选择全部资源。 聚合规则:左侧下拉菜单选择“平均值”,右侧下拉菜单选择“云服务器”。 展示规则:左侧下拉菜单选择“降序”,右侧输入值设置50。
用本章节提供的手工方式配置Agent。 约束与限制 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已成功安装Agent插件。 Linux系统 确认正在使用的Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。
删除自定义指标/事件告警模板 当您不再需要某个自定义告警/事件模板时,可以对其执行删除操作。删除操作无法恢复,请谨慎操作。 删除自定义指标告警模板 登录云监控服务管理控制台。 选择“告警 > 告警模板”,进入告警模板界面。 单击“自定义指标告警模板”页签,删除自定义指标告警模板。 单个删除 在“自定
复制自定义指标/事件告警模板 当您需要通过已存在的告警模板或事件模板快速创建一个相同配置的模板时,可以使用复制功能,简化操作。 操作步骤 登录云监控服务管理控制台。 选择“告警 > 告警模板”,进入告警模板界面。 选择“默认指标告警模板”或“默认事件模板,单击告警模板所在行“操作”列的“ 复制”;
} ], "count" : 10 } 状态码 状态码 描述 200 查询成功 400 参数校验失败 404 资源不存在 500 系统内部错误 错误码 请参见错误码。 父主题: 指标管理
取值范围: 只能为字母或者数字,字符长度为[1,64] 默认取值: 不涉及。 namespace String 参数解释: 查询服务的命名空间,各服务命名空间请参考“服务命名空间”。 约束限制: 不涉及。 取值范围: 格式为service.item;service和item必须是字符串,必
的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 约束限制: 不涉及。 取值范围: 必须以字母开头,只能包含0-9/a-z/A-Z/_/-;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo
ange。 请执行如下命令,重启Agent。 Windows系统下: 在Agent安装包存放目录下,先双击执行shutdown.bat脚本,停止Agent,再执行start.bat脚本,启动Agent。 Linux系统下: 执行以下命令查看telescope的PID。 ps -ef
如何将告警通知发送给子账号? 如您想要将告警通知发给子账号,可以通过创建主题并添加订阅(在订阅信息中配置您的手机号码或邮箱),然后在创建告警规则时选择告警通知对象为您创建的主题 。 父主题: 告警
stat、sar等系统命令也受到影响。 经过分析,这种改动只涉及4.19、4.20版本,之前或之后的版本通过当前方式能够准确计算出磁盘I/O使用率,且当前使用的计算方式是业界通用实现(与系统命令iostat计算方式一致)。 解决方式 该问题只出现在特定操作系统版本中,建议客户升级或回退操作系统内核。
名称,若选多个已有模板,指标信息按资源类型区分。 选择“自定义创建”:自定义创建告警模板。 添加资源类型 弹性云服务器 配置告警模板监控的服务名称。 说明: 每种服务最多可添加50条资源类型。 告警策略 CPU使用率的原始值,连续3次≥80%,则触发紧急告警,每1天告警一次。 触发告警规则的告警策略。
、Windows平台管理Agent。 云监控服务仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。 前提条件
支持审计的操作列表 表1 云审计服务支持的Cloud Eye操作列表 操作名称 资源类型 事件名称 创建告警规则 alarm_rule createAlarmRule 批量创建告警规则 alarm_rule batchCreateAlarmRule 更新告警规则 alarm_rule
自动升级插件失败时,可以通过手动方式升级Agent。 支持Agent一键安装的系统请参考Agent支持的系统有哪些? 无。 全量自动化升级插件 登录云监控服务管理控制台。 单击“主机监控 > 弹性云服务器”,进入主机监控页面。 单击“安装&升级插件 > 全量安装&升级插件”,在右侧弹出安装&升级插件指引。
Agent版本特性 本章节为您介绍云监控插件的版本发布信息。 CES Agent支持的镜像列表,参见 Agent支持的系统有哪些? CES Agent迭代版本已知版本特性如下: 2.7.6.1版本 分类 说明 发布时间 2025-04-15 新特性 基于2.7.6版本: NPU指标采集加固。
目前主流的操作系统已经支持了一键安装功能。支持Agent一键安装的系统请参考Agent支持的系统有哪些? 自定义自动化安装Agent 云监控服务支持控制台一键安装云监控插件功能。若您只需要为部分主机资源安装云监控插件,并且主机资源已支持一键安装,推荐您通过云监控服务控制台相关功能,自动为指定主机资源安装云监控插件。
资源所属的云产品,一般由"服务命名空间,服务首层维度名称"组成,如"SYS.ECS,instance_id" 约束限制 不涉及 取值范围 长度[0,128]个字符 默认取值 不涉及 namespace 是 String 参数解释 查询服务的命名空间,各服务命名空间请参考“服务命名空间” 约束限制
"notification_end_time" : "23:59" } 状态码 状态码 描述 200 修改告警规则告警通知信息成功 400 参数校验失败 500 系统内部错误 错误码 请参见错误码。 父主题: 告警通知
参数解释: 资源的监控指标名称,各服务的指标名称可查看:“服务指标名称”。 约束限制: 不涉及。 取值范围: 必须以字母开头,只能包含0-9/a-z/A-Z/_/-。字符长度最短为1,最大为96。如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中