检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。
操作步骤 登录云监控服务管理控制台。 选择左侧导航的“我的看板 > 自定义监控看板”,单击需要添加监控视图的看板名称,进入我的看板中,然后单击“新建”,可根据需求选择“新建视图”或“新建视图分组”。 单击“新建视图”,系统弹出“添加监控视图”窗口。 在“添加监控视图”界面。
配置指标告警 监控最核心的职责是帮助用户发现问题,而问题的发现是依赖监控系统中对告警规则的配置,告警规则配置的覆盖率、准确率将直接影响监控系统的故障发现率。
操作步骤 登录云监控服务管理控制台。 单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 单击页面右上角的“创建告警屏蔽”。 在“创建屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 图1 创建告警屏蔽 表1 配置参数 参数 参数说明 名称 告警屏蔽规则的名称。
部分Windows系统升级Agent插件失败 Linux系统磁盘I/O使用率显示不准确
read_bytes_intranet 原始值 1 环比下降 100 - % 3小时 文件系统写带宽 write_bytes_intranet 原始值 1 环比下降 100 - % 3小时 文件系统读TPS read_tps 原始值 1 环比下降 100 - % 3小时 文件系统写
事件监控类型 您可以在事件监控中查看系统事件和自定义事件的监控详情。 事件类型 说明 系统事件 目前支持的系统事件请参见事件监控支持的事件说明。 自定义事件 事件监控为您提供上报自定义事件的接口,方便您将业务产生的异常事件或重要变更事件采集上报到云监控服务。
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。
503 Service Unavailable 系统暂时不可用,请求受限。 错误码 请参考返回错误码说明。 父主题: 事件监控
购买云服务资源后,在云监控服务查看不到监控数据 用户购买云服务资源后,首先需要确认该服务是否已对接云监控服务,系统正在对接更多的云服务,在此之前用户无法查看到未对接服务资源的监控数据。
最大值 聚合周期内指标数据的最高数值,是监控系统中识别峰值和潜在问题的重要指标。 最小值 聚合周期内指标数据的最低数值,是监控系统中识别异常低值(例如:流量突降为0)和潜在问题的重要指标。
如果输入的数据类型是整数,系统会对数据进行取整处理。 如果输入的数据类型是小数(浮点数),系统会保留数据的小数点后两位。 例如,弹性伸缩中“实例数”的数据类型为整数。
主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。
执行命令修改配置文件: cd /usr/local/uniagent/extension/install/telescope/conf && vi custom_conf.json 在{}中填入如下配置内容,配置内容的斜体部分请参考弹性云服务器支持的操作系统监控指标(安装Agent
EVENT.SYS表示系统事件。 EVENT.CUSTOM表示自定义事件。 sub_event_type String 否 参数解释: 事件子类。 取值范围: 枚举类型。 当事件类型为系统事件时,参数值为SUB_EVENT.OPS或SUB_EVENT.PLAN。
Windows系统下: 在Agent安装包存放目录下,先双击执行shutdown.bat脚本,停止Agent,再执行start.bat脚本,启动Agent。 Linux系统下: 执行以下命令查看telescope的PID。
主机监控 概览 云监控插件(Agent) 查看操作系统监控指标 查看基础监控指标 进程监控 创建主机监控的告警通知 查看资源详情 父主题: 云资源监控
告警通知 告警通知系统模板更新记录 创建通知对象/通知组 创建/修改/删除通知策略 修改通知对象/通知组 删除通知对象/通知组 创建/删除/复制/修改通知内容模板 创建告警通知主题 父主题: 告警
表1 展示全量已对接云监控的云服务的功能点 功能 具体场景 创建告警规则 创建告警规则页面,告警类型选择“事件”,事件类型选择“系统事件”,事件来源列表会展示全量已对接云监控的云服务。 一键告警 在一键告警页面中会展示全量已对接云监控的云服务。
不同操作系统支持的基础监控指标情况请参考弹性云服务器监控指标支持列表。 如需要监控内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率,请安装主机监控Agent。 父主题: 主机监控