检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控 通过AOM您可监控主机的资源占用与健康状态,监控主机的磁盘、文件系统等常用系统设备,监控运行在主机上的业务进程或实例的资源占用与健康状态。 容器监控 容器监控的对象仅为通过CCE部署的工作负载、通过ServiceStage创建应用。 指标浏览 指标浏览展示了各资源的指标数据
可选参数,用于补充说明该委托代理的详细信息。 - 单击“下一步”,进入“授权”页面。 在“选择策略”页签选择“DMS UserAccess”策略,并单击“下一步”。 DMS UserAccess策略:分布式消息服务普通用户权限(无实例创建、修改、删除、扩容、转储)。 在“设置最小授权范围”页
- 单击“完成”,在授权的确认弹窗中,单击“立即授权”,进入“授权”页面。 在“选择策略”页签选择“DMS UserAccess”策略,并单击“下一步”。 DMS UserAccess策略:分布式消息服务普通用户权限(无实例创建、修改、删除、扩容、转储)。 在“设置最小授权范围”页
"error", "errorType" : "auth", "error" : "auth project_id not pass." } 状态码:422 Unprocessable 表达式无法执行。 { "status" : "error", "errorType"
多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码
安装Node Exporter:勾选一个或多个需要安装Node Exporter主机前的复选框。 单击“一键安装”,完成Node Exporter安装。 安装完成后,由UniAgent创建采集任务,Node Exporter插件即可采集主机的相关指标。Node Exporter采集的具体指标
多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码
重新加载配置文件失败的总数。 serviceMonitor/monitoring/kube-apiserver/0 apiserver aggregator_unavailable_apiservice 不可用的apiservice数量。 apiserver_admission_controller_ad
AOM全面对接开源Prometheus生态,将容器服务Kubernetes集群接入Prometheus监控,通过Grafana大盘监控主机和Kubernetes集群的众多性能指标。 通过CCE的kube-prometheus-stack插件、自建K8s集群、ServiceMonitor、PodMoni
非法请求。建议直接修改该请求,不要重试该请求。 { "error_code" : "AOM.05008002", "error_msg" : "dashboard folder title or id is empty", "error_type" : "BAD_REQUEST"
监控组件性能指标 设置组件监控开关 查看组件性能指标 查看组件概览 通过拓扑图查看组件间调用关系 通过Profiler分析代码性能 通过Debugging诊断代码 查看组件接口调用监控项 查看组件基础监控项 查看组件异常日志 查看组件外部调用监控项 查看组件通信协议监控项 查看组件数据库监控项
"error", "errorType" : "auth", "error" : "auth project_id not pass." } 状态码:422 Unprocessable 表达式无法执行。 { "status" : "error", "errorType"
"error", "errorType" : "auth", "error" : "auth project_id not pass." } 状态码:422 Unprocessable 表达式无法执行。 { "status" : "error", "errorType"
1440。 timerange/period≤1440,在计算时,timerange和period需换算为相同的单位。 statistics 是 Array maximum,minimum,sum,average,sampleCount 统计方式 Header说明 请求消息头(Header)如表3所示。
云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。典型场景例如:将者第三方云厂商或互联网数据中心(Internet Data Center,以下简称IDC)的自建Prometheus对接到AOM的Prometheus实例中。 图1 第三方云厂商或IDC自建Prometheus对接到AOM
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息
Windows环境下安装icagent失败,并提示SERVICE STOP 现象:在Windows环境下安装icagent失败,提示SERVICE STOP。任务管理器中不存在icagent任务。系统服务列表中不存在icagent服务。命令行下执行sc query icagent提示未找到。 原因
容器被限流的CPU时间。 文件系统/磁盘 container_fs_inodes_free 文件系统的可用inode数量。 container_fs_usage_bytes 文件系统的使用量。 container_fs_inodes_total 文件系统的总计inode数量。 container_fs_io_current
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息
+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。 告警源:触发告警或事件的服务名称。可以设置为AOM 、LTS、CCE等服务名称。例如设置为:告警源+等于+AOM。