检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
父主题: 运维管理(即将下线)
告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM可以支持设置阈值告警的指标类型如下。
部分支持 只支持指标数据和系统性能数据的可视化监控,不支持日志数据的监控。 支持 告警管理 对服务设置事件条件或者对资源的指标设置阈值条件,当AOM自身或外部服务存在异常或可能存在异常而产生告警时,将告警信息以邮件、短信、企业微信等方式发送给指定的人员。
父主题: 运维管理(即将下线)
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。
在卡片左下角通过勾选“隐藏系统组件”可隐藏系统组件。 集群监控(磁盘)卡片 图5 集群监控(磁盘) 此卡片主要展示了3种信息: 统计最新时间前1分钟内的集群的磁盘使用率在TOP5的集群信息。
资源接入AOM 安装ICAgent(华为云主机) 安装ICAgent(非华为云主机) ICAgent版本说明 配置应用发现规则 配置日志采集路径
在展开的列表中,当指标数据满足设置的告警条件时,在告警界面就会生成一条指标类告警,您可在左侧导航栏中选择“告警管理 > 告警列表”,在告警列表中查看该告警。当指标数据满足已设的通知策略,系统就会以邮件、短信等方式发送告警通知给指定人员。
数据保护技术 AOM通过多种数据保护手段和特性,保障AOM的数据安全可靠。 表1 AOM的数据保护手段和特性 数据保护手段 简要说明 详细介绍 传输加密(HTTPS) AOM支持HTTPS传输协议,保证数据传输的安全性。 构造请求 数据冗余存储 指标、告警、配置等数据以多副本方式存储
状态码 状态码如表1所示。 表1 状态码 状态码 编码 错误码说明 100 Continue 继续请求。 这个临时响应用来通知客户端,它的部分请求已经被服务器接收,且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。 例如,切换到HTTP
安装ICAgent过程中,系统提示“no crontab for root”是什么原因? AOM配置日志转储时无法选中obs桶是什么原因? Grafana无法展示内容是什么原因?
hideSyslog 否 Integer 搜索时是否隐藏系统日志: 0:隐藏,默认为0。 1:显示。 keyWord 否 String 1.支持关键词精确搜索。关键词指相邻两个分词符之间的单词。 2.支持关键词模糊匹配搜索,例如输入“RROR”或“ERRO?”
其他常见问题 AOM 1.0与AOM 2.0使用对比 AOM与APM有何区别? AOM的日志服务与LTS的日志服务有何区别? 如何创建委托apm_admin_trust?
仪表盘 仪表盘功能支持导入Grafana视图吗?
入口为:“应用洞察 > 应用监控” 主要监控用户通过应用资源管理功能统一管理的所有资源对象与应用,通过该应用监控可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。 入口为:“进程监控 > 应用监控” 主要监控通过应用发现规则发现的进程对应的应用。
在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右侧的下拉列表框中选择“其他:用户自定义接入主机”。 选择主机后,单击“升级ICAgent”。 从下拉列表选择合适的AOM 2.0目标版本,单击“确定”。
具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指标存储时长功能受限白名单开放,如有需求可以通过提交工单,为您开放此功能。 配置指标存储时长 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。
委托授权 执行此任务需要授权的委托,系统默认勾选。 创建日志生成指标任务,需要您授权LTS和AOM创建云服务委托:lts_admin_trust、aom_admin_trust。
配置应用发现规则 在左侧导航栏中选择“配置管理 > 应用发现”。 单击“添加自定义应用发现规则”,配置应用发现规则。 选择预探测主机。 自定义一个规则规则名称(例如,rule-test)。