检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作系统监控GPU页面显示无记录该如何处理? 在查看主机监控的监控指标时,如果出现操作系统监控GPU、NPU、DAVP、RoCE分组主机监控无数据的问题,请先确认您的机器是否支持以上类型。
操作记录审计 云监控服务通过云审计服务(Cloud Trace Service,简称CTS)为您提供云监控服务的操作记录,记录内容包括您从公有云管理控制台或者开放API发起的云监控服务操作请求以及每次请求的结果,供您查询、审计和回溯使用。
支持Agent一键安装的系统请参考Agent支持的系统有哪些? 无。 全量自动化升级插件 登录云监控服务管理控制台。 单击“主机监控 > 弹性云服务器”,进入主机监控页面。 单击“安装&升级插件 > 全量安装&升级插件”,在右侧弹出安装&升级插件指引。
问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。 使用root账号,登录ECS。
创建自定义告警模板 登录云监控服务管理控制台。 在左侧导航树中选择“告警 > 告警模板”。 单击“创建自定义模板”,参考表3配置参数。 图2 配置告警模板参数 表3 配置告警模板参数 参数 示例 参数说明 名称 ECS-常规告警 系统会随机产生一个模板名称,用户也可以进行修改。
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 监控数据中会出现跳点的情况 入网带宽和出网带宽出现负值
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。
使用hinicadm temperature -i <dev_id>命令采集。 HiNIC网卡事件记录 HiNIC网卡心跳丢失计数、PCIE异常计数、芯片错误计数、芯片健康状态等。 使用hinicadm event -i <dev_id>命令采集。
Agent的CPU使用率和内存使用率查询方法: Linux: top -p telescope的PID Windows: 在任务管理器中查看Agent进程详情。
登录云监控服务管理控制台。 单击左侧导航栏的“网络性能监控 > 云网络互访性能”。 “区域内网络性能”页面,在“选择Region”下拉框中选择待查看的区域,即可通过表格形式查看可用区之间的互访性能数据,表格中单个方格的颜色取决于对应的访问路径的时延数据值。
对于使用模板创建的告警规则,可直接在模板中修改告警策略,会直接生效于使用该模板创建的所有告警规则,直接提升运维创建告警规则的效率,同时更高效的管理告警规则。 您还可以在告警模板中根据需要创建自定义指标/事件告警模板。 父主题: 告警模板
操作步骤 登录管理控制台。 单击“服务列表 > 云监控”。 单击左侧导航栏的“站点监控”。 在“站点监控”界面,单击右上角“创建站点监控”,进入“创建站点监控”界面。 在弹出的“创建站点监控”对话框中根据界面提示配置参数,如图1所示。
图5 插件状态 步骤二:查看主机监控指标 登录管理控制台 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控 > 弹性云服务器”,进入主机监控页面。
采集方式(linux):通过调用gpu卡驱动库libnvidia-ml.so.1的NvmlDeviceGetTemperature接口获取gpu温度。
告警规则支持企业项目,当选择了告警规则到某个企业项目时,只有拥有该企业项目权限的用户才可以查看和管理该告警规则。 介绍视频 通过视频了解告警的主要功能。 父主题: 告警
操作步骤如下: 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“云服务监控 > 告警 > 告警规则 > 创建告警规则”进入创建告警规则页面。
查看资源包用量 登录云监控服务管理控制台。 选择“网络性能监控 > 广域网质量监控”。 单击右上角“查看资源包用量”,进入“资源包”页面。 在“资源包”页面,可以查看购买的资源包、剩余量和使用明细。 父主题: 广域网质量监控(公测)
创建告警规则 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控 > 弹性云服务器”,进入主机监控页面。 单击弹性云服务器所在栏右侧的“更多”按钮,选择“创建告警规则”。
修改自定义指标/事件告警模板 登录云监控服务管理控制台。 选择“告警 > 告警模板”,进入告警模板界面。 单击“自定义指标告警模板”或“自定义事件告警模板”页签。 单击模板所在行的“修改”。 参考表1,修改已配置的参数。
登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知对象”页签,单击“创建通知对象”或单击已有通知对象的“编辑”操作进入配置页面。 单击“选择渠道”,勾选“钉钉”选项。