检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 查询Prometheus实例下区间数据 (推荐)POST
Prometheus实例 新增Prometheus实例 卸载托管Prometheus实例 修改Prometheus实例 查询Prometheus实例 创建Prometheus实例的预聚合规则 修改Prometheus实例的预聚合规则 查询Prometheus实例的预聚合规则 获取Prometheus
其他常见问题 AOM 1.0与AOM 2.0使用对比 AOM与APM有何区别? AOM的日志服务与LTS的日志服务有何区别? 如何创建委托apm_admin_trust? 为什么需要创建网络连接通道? 创建数据订阅规则时报错“请求资源存在冲突”
日志分析 AOM展示的日志是否为实时日志? 怎样查看AOM中的日志是通过哪个应用产生的?
基础设施监控 通过helm部署pod后,AOM无法查找到工作负载
父主题: 运维管理(即将下线)
volume_manager_total_volumes 卷管理中的卷数量。 rest_client_requests_total 请求apiserver的总数(按照返回码code和请求类型method统计)。
父主题: 告警管理
标注+aom_monitor_level+等于+infrastructure 首次触发时间 告警首次触发的时间范围。支持按照“在指定范围内”,“不在指定范围内”进行条件匹配。
涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式统一,部分指标被重命名。
告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。
您也可以在应用之间通过消息通知服务实现应用的功能集成,降低系统的复杂性。
系统指标的命名空间:命名空间是固定不变的,均以“PAAS.”开头,如表1所示。 表1 系统指标命名空间 命名空间名称 说明 PAAS.AGGR 集群指标的命名空间。 PAAS.NODE 主机指标、网络指标、磁盘指标和文件系统指标的命名空间。
状态码 状态码如表1所示。 表1 状态码 状态码 编码 错误码说明 100 Continue 继续请求。 这个临时响应用来通知客户端,它的部分请求已经被服务器接收,且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。 例如,切换到HTTP
具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指标存储时长功能受限白名单开放,如有需求可以通过提交工单,为您开放此功能。 配置指标存储时长 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。
委托授权 执行此任务需要授权的委托,系统默认勾选。 创建日志生成指标任务,需要您授权LTS和AOM创建云服务委托:lts_admin_trust、aom_admin_trust。
查看默认观测项目:页面右侧展示默认观测项目,包括:Parameters、Return Object、Thrown Exception以及Target。 选择重载方法:在下拉菜单中,重新选择一个方法。 设置过滤条件:设置方法执行条件,过滤出符合条件的方法记录。
您可以通过设置AOM系统权限或者细粒度权限进行权限最小化的安全管控。详情请参见AOM权限管理。
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。
在左侧导航栏单击“指标管理”,在“指标”页签下指标即可查看当前Prometheus实例所有指标的指标名、指标类型等信息。 根据需要删除自定义指标。 废弃一个指标:选择一个指标,单击操作列的。