检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Windows系统: cd C:\Program Files\uniagent\extension\install\telescope Linux系统: cd /usr/local/uniagent/extension/install/telescope/bin 执行以下命令,打开配置文件
操作系统监控GPU页面显示无记录该如何处理? 执行命令安装Agent报错该如何处理? 为什么中文操作系统下安装了CES Agent后查看操作系统监控没有指标值? 如何通过修改配置文件开启/关闭指标采集? 如何通过修改配置文件调整Agent资源消耗阈值?
说明: 部分云服务暂时不支持资源名称、企业项目、资源标签、私网IP和公网IP字段,如果选择系统模板作为通知内容模板,发送告警通知时将不会显示这些字段。 - 生效时间 当通知方式选择通知组或主题订阅时,需要设置生效时间。
完成工单提交:等待系统回复,当出现华为云工程师系统角色提示您确认风险的回复后,输入“风险已知晓,继续开通”,等待系统回复,完成公测协议开通。 企业微信群消息,钉钉群消息,飞书群消息有发送条数限制和接收方系统故障情况,可能会导致消息发送失败。
支持通过一键安装功能进行自动化升级的系统均可通过自动化升级的功能升级Agent。支持Agent一键安装的系统请参考Agent支持的系统有哪些? 自定义自动化升级插件 云监控服务支持控制台自动化升级云监控插件功能。
您可以选择系统提供的固定时长或自定义时间段来查看云服务的监控周期内的走势图。 在监控项详情页面,其中“近1小时”、“近3小时”、“近12小时”、“近24小时”以内的监控时长系统默认显示原始指标数据,“近7天”、“近30天”以内的监控时长系统默认显示聚合指标数据。
事件监控类型 您可以在事件监控中查看系统事件和自定义事件的监控详情。 事件类型 说明 系统事件 目前支持的系统事件请参见事件监控支持的事件说明。 自定义事件 事件监控为您提供上报自定义事件的接口,方便您将业务产生的异常事件或重要变更事件采集上报到云监控服务。
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。
操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。 使用root账号,登录ECS。
表2列出了云监控服务常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。
查看方法如下:在操作系统监控指标查看页面,选择“磁盘”页签,然后选择右侧的挂载点,如图1所示。 图1 在操作系统监控页面查看数据盘的磁盘使用率 父主题: 告警
图7 查看监控指标 图8 操作系统监控 进入指标详情页展示操作系统监控和基础监控,操作系统监控下展示的指标就是安装了Agent之后会展示出来的指标,如果操作系统监控为空,可以安装Agent成功之后再进行查看。
事件即云监控服务保存并监控的云服务资源的关键操作,您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。
单击资源所在行的“查看监控指标”,进入“操作系统监控”页面。 单击“操作系统监控”右侧的“进程监控”,进入“进程监控”页面。 在“系统进程数”页面,展示了主机上运行的进程数据。系统进程查询结果的指标说明如表4所示。
云监控服务提供系统策略及操作与策略权限一览表,请参见:云监控服务系统策略。 父主题: 权限管理
您可以选择系统提供的固定时长或自定义时间段来查看云服务的监控周期内的走势图。 在监控项详情页面,其中“近1小时”、“近3小时”、“近12小时”、“近24小时”以内的监控时长系统默认显示原始指标数据,“近7天”及以上的监控时长系统默认显示聚合指标数据。
购买云服务资源后,在云监控服务查看不到监控数据 用户购买云服务资源后,首先需要确认该服务是否已对接云监控服务,系统正在对接更多的云服务,在此之前用户无法查看到未对接服务资源的监控数据。
可使用站点监控对网站的可用性进行监控,并且对类目、用户、交易、店铺等接口进行持续拨测,测试接口的可用性,判断业务系统是否正常。 本章节以www.example.com为例,创建站点监控,并为站点的可用性、响应时间、丢包率创建告警规则,当发生异常时通知用户及时处理。
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。