检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。 查看CCE集群 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。
查询系统中已有服务发现规则 功能介绍 该接口用于查询系统当前已存在的服务发现规则。 调用方法 请参见如何调用API。
前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。 查看CCE集群 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。
例如java的日志异常监控,一旦用户采用log系统打印日志,就会被采集上来。具体的异常采集类型会根据不同的采集器类型有变化。 相关配置请参见查看组件异常日志。
将AOM仪表盘图表页面嵌入用户自建系统 AOM支持将仪表盘图表页面嵌入到客户自建系统。通过统一身份认证服务IAM的联邦代理机制实现用户自定义身份代理,再将登录链接嵌入至用户自建系统实现无需在华为云官网登录就可在自建系统界面查看AOM仪表盘图表页面。
物理磁盘已使用总容量和物理磁盘总容量指标仅统计本地磁盘分区的文件系统类型,不统计主机通过网络形式挂载的文件系统(juicefs、nfs、smb等)。 表2 主机指标维度 维度 说明 clusterId 集群ID。 clusterName 集群名称。 gpuName GPU名称。
设置组件监控开关 AOM支持设置如下APM组件监控开关: 自定义设置:支持设置关联日志服务开关项、组件与基础设施关联分析开关项、Profiler性能剖析开关项、全采样开关项。 Agent设置:支持管理APM探针启停状态。 监控项:支持查看监控项,以及启停监控项。 自定义设置 自定义设置支持的配置项包括
安装ICAgent过程中,系统提示“no crontab for root”是什么原因? 问题描述 安装ICAgent过程中,系统提示“no crontab for root”。
卸载ICAgent 服务器上的ICAgent被卸载后,会影响该服务器的运维能力,导致拓扑、调用链等功能不可用,请谨慎操作! 通过界面卸载:此操作适用于正常安装ICAgent后需卸载的场景。 登录服务器卸载:此操作适用于未成功安装ICAgent需卸载重装的场景。 通过界面卸载 登录AOM
搜索应用时,系统提示“AOM.11007006: get policy list failed.” 问题描述 在应用资源管理的“首页”界面进行资源检索时,系统提示“AOM.11007006: get policy list failed.”
Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQL以及数据可视化展示等。更多信息请参见Prometheus官方文档。 Prometheus实例是AOM服务提供的管理Prometheus数据采集和数据存储分析的逻辑单元。
Prometheus 实例类型:系统默认选择为“Prometheus for ECS”,不可修改。 选择 Prometheus 实例:在下拉列表中选择Prometheus 实例。
2019-8-30 容器指标增加对“文件系统可用”“文件系统容量”和“文件系统使用率”的支持。 主机和容器指标增加对NPU指标的支持。 2019-8-21 支持统计分析APP的用户运营数据,便于您更有针对性地开展运营活动。
操作系统使用限制 AOM支持多个操作系统,在购买主机时您需选择AOM支持的操作系统,详见表1,否则无法使用AOM对主机进行监控。
0~100 百分比(%) aom_node_npu_temperature_centigrade NPU温度 该指标用于统计NPU的温度。仅支持CCE类型主机的NPU指标采集。
约束与限制 操作系统使用限制 AOM支持多个操作系统,在购买主机时您需选择AOM支持的操作系统,详见表1,否则无法使用AOM对主机进行监控。
最小值:1 最大值:5 is_turn_on 否 Boolean 阈值规则是否启用。 insufficient_data_actions 否 Array of strings 数据不足通知列表。 metric_name 是 String 时间序列名称。
图1 巡检与问题定界 立体化运维 您需全方位掌控系统的运行状态,并快速响应各类问题。 AOM提供从云平台到资源,再到应用的监控和微服务调用链的立体化运维分析能力。 优势 体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。
高危命令说明 高危命令指影响系统或服务的正常运行,或造成系统特殊文件被恶意删除或修改命令。自动化运维服务涉及的高危命令请参见表1。
查看默认观测项目:页面右侧展示默认观测项目,包括:Parameters、Return Object、Thrown Exception以及Target。 选择重载方法:在下拉菜单中,重新选择一个方法。 设置过滤条件:设置方法执行条件,过滤出符合条件的方法记录。