检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些? 建议用户使用主机监控的主机规格为:Linux使用“2vCPUs | 4GiB”、Windows使用“4vCPUs | 8GiB”或更高配置。
目前主流的操作系统已经支持了一键安装功能。支持Agent一键安装的系统请参考Agent支持的系统有哪些? 自定义自动化安装Agent 云监控服务支持控制台一键安装云监控插件功能。
入门实践 当您了解了云监控服务的功能后,可以根据自身的业务需求使用云监控服务搭建业务的系统级监控。 本文介绍云监控服务常用最佳实践,帮助您更好的使用云监控服务。
说明: 部分云服务暂时不支持资源名称、企业项目、资源标签、私网IP和公网IP字段,如果选择系统模板作为通知内容模板,发送告警通知时将不会显示这些字段。 生效时间 该告警仅在生效时间段发送通知消息,非生效时段则在隔日生效时段发送通知消息。
因此需使用弹性负载均衡将访问流量根据转发策略分发到后端多台弹性云服务器,通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。
系统仅在生效时间内发送告警通知消息。 触发条件 依次勾选出现告警、恢复正常 当通知方式选择主题订阅时,可以选择“出现告警”、“恢复正常”两种状态,作为触发告警通知的条件。 根据界面提示,配置归属企业项目。
静态阈值 事件类型 当告警类型选择事件时,需要选择事件类型,可选择系统事件或自定义事件。各云服务支持的事件请参考事件监控支持的事件说明。 系统事件 事件来源 当告警类型选择事件时,需要设置事件来源。 当事件类型选择系统事件时,在下拉列表中选择事件来源的云服务名称。
Windows系统: cd C:\Program Files\uniagent\extension\install\telescope Linux系统: cd /usr/local/uniagent/extension/install/telescope/bin 执行以下命令,打开配置文件
操作系统监控GPU页面显示无记录该如何处理? 执行命令安装Agent报错该如何处理? 为什么中文操作系统下安装了CES Agent后查看操作系统监控没有指标值? 如何通过修改配置文件开启/关闭指标采集? 如何通过修改配置文件调整Agent资源消耗阈值?
说明: 部分云服务暂时不支持资源名称、企业项目、资源标签、私网IP和公网IP字段,如果选择系统模板作为通知内容模板,发送告警通知时将不会显示这些字段。 - 生效时间 当通知方式选择通知组或主题订阅时,需要设置生效时间。
查看分组列表 资源分组列表展示用户在云监控服务拥有的全部资源分组及各个分组的资源和健康度概况。 操作步骤 登录云监控服务管理控制台。 单击页面左侧的“资源分组”,进入“资源分组”页面。 在“资源分组”页面可以查看用户创建的所有资源分组,资源分组参数说明如表1所示。 表1 资源分组列表参数说明
完成工单提交:等待系统回复,当出现华为云工程师系统角色提示您确认风险的回复后,输入“风险已知晓,继续开通”,等待系统回复,完成公测协议开通。 企业微信群消息,钉钉群消息,飞书群消息有发送条数限制和接收方系统故障情况,可能会导致消息发送失败。
支持通过一键安装功能进行自动化升级的系统均可通过自动化升级的功能升级Agent。支持Agent一键安装的系统请参考Agent支持的系统有哪些? 自定义自动化升级插件 云监控服务支持控制台自动化升级云监控插件功能。
事件监控类型 您可以在事件监控中查看系统事件和自定义事件的监控详情。 事件类型 说明 系统事件 目前支持的系统事件请参见事件监控支持的事件说明。 自定义事件 事件监控为您提供上报自定义事件的接口,方便您将业务产生的异常事件或重要变更事件采集上报到云监控服务。
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。
您可以选择系统提供的固定时长或自定义时间段来查看云服务的监控周期内的走势图。 在监控项详情页面,其中“近1小时”、“近3小时”、“近12小时”、“近24小时”以内的监控时长系统默认显示原始指标数据,“近7天”、“近30天”以内的监控时长系统默认显示聚合指标数据。
EVENT.SYS表示系统事件,EVENT.CUSTOM表示自定义事件。 event_name String 否 事件名称,值为系统产生的事件名称或用户自定义上报的事件名称。
表2列出了云监控服务常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。
操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
tags" : [ { "key" : "key1", "value" : "value1" } ] } 响应示例 无 状态码 状态码 描述 204 No Content 400 参数校验失败 401 未认证 403 认证鉴权失败 404 资源不存在 500 系统内部错误