检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
表1 展示全量已对接云监控的云服务的功能点 功能 具体场景 创建告警规则 创建告警规则页面,告警类型选择“事件”,事件类型选择“系统事件”,事件来源列表会展示全量已对接云监控的云服务。 一键告警 在一键告警页面中会展示全量已对接云监控的云服务。
instance_id Value:存储库名称/ID 云备份监控指标说明 云存储网关 SYS.CSG Key:gateway_id Value:网关ID 云存储网关监控指标说明 高性能弹性文件服务 SYS.EFS Key:efs_instance_id Value:实例 SFS Turbo
instance_id Value:存储库名称/ID 云备份监控指标说明 云存储网关 SYS.CSG Key:gateway_id Value:网关ID 云存储网关监控指标说明 高性能弹性文件服务 SYS.EFS Key:efs_instance_id Value:实例 SFS Turbo
约束与限制 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已成功安装Agent插件。 Linux系统 确认正在使用的Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。
通过使用cloudeye-exporter,可以将CES服务与本地的Prometheus系统对接,继而使用Prometheus系统对云上资源的性能数据进行监控运维。 商用 Prometheus如何监控华为云所有服务 2 新增分布式消息服务 DMS的监控指标。
当通知方式选择通知组或主题订阅时,支持配置通知内容模板,通知内容模板可以选择系统模板、默认模板和自定义模板。 系统模板是云监控服务系统自动提供的告警通知内容模板,用户无法进行修改 ,当用户未选择自定义告警通知内容模板时,告警会按系统模板的内容发送告警通知内容。
使用API接口查询监控数据 大型企业内部通常有自建的运维监控系统,在将系统迁移到华为云平台过程中会面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据,从而将华为云的监控数据与现有系统进行集成。
采集方式(linux):通过调用gpu卡驱动库libnvidia-ml.so.1的NvmlDeviceGetTemperature接口获取gpu温度。
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。
多种通知方式 通过在告警规则中开启消息通知,当云服务的状态变化触发告警规则设置的阈值时,系统提供短信、邮件、语音通知、FunctionGraph(函数)、FunctionGraph(工作流)、企业微信、钉钉、飞书和Welink通知,还可以通过HTTP、HTTPS将告警信息发送至告警服务器
主机状态运行中,插件状态显示未安装,并且主机操作系统支持一键安装,支持一键安装的系统请参见Agent支持的系统有哪些? 不能安装&升级插件的可能原因: 主机状态未在运行中。 插件状态故障,插件故障状态及处理方法请参见Agent插件状态显示“故障”该如何处理?
主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
云监控服务提供系统策略及操作与策略权限一览表,请参见:云监控服务系统策略。 图1 查看权限 父主题: 权限管理
云监控服务仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。 前提条件 已成功安装Agent插件。
系统弹出“创建Dashboard”窗口。 配置参数。 名称:表示监控看板名称,该参数只能由中文、英文字母、数字、下划线、中划线组成,且长度不超过128。 归属企业项目:将监控看板关联给到某个企业项目时,只有拥有该企业项目权限的用户才可以查看和管理该监控看板。
环境准备 以Ubuntu 18.04系统和Prometheus 2.14.0版本为例。
使用hinicadm temperature -i <dev_id>命令采集。 HiNIC网卡事件记录 HiNIC网卡心跳丢失计数、PCIE异常计数、芯片错误计数、芯片健康状态等。 使用hinicadm event -i <dev_id>命令采集。
系统进入“服务配额”页面。 图1 我的配额 您可以在“服务配额”页面,查看各项资源的总配额及使用情况。 如果当前配额不能满足业务要求,请参考后续操作,申请扩大配额。 如何申请扩大配额? 登录云监控服务管理控制台。 在页面右上角,选择“资源 > 我的配额”。