检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如需查看Prometheus格式命令行的详细说明,请将光标移至搜索框后的处,单击“了解更多”。 系统自动填充:不确定指标信息或对Prometheus格式不了解时,可采用系统自动填充方式。系统自动填充方式需要从“指标浏览”界面跳转后填充。 具体操作:在左侧导航栏中选择“监控 > 指标浏
AOM 2.0默认支持的指标存储时长为15天。15天内免费使用,超过15天则按量累计计费。 数据转储量 AOM支持的指标数据转储量。 计费周期 系统会在每日的固定时间统一结算前一天产生的按量费用,每日的13:00~22:00生成前一天账单并发送用户,并自动通过用户账户余额进行抵扣。具体
创建Prometheus实例的预聚合规则 功能介绍 该接口用于给Prometheus实例创建预聚合规则。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/{prometheus_instance}/aom/api/v1/rules 表1 路径参数
SASL_SSL参数 参数 说明 示例 用户名 SASL用户名用于实例访问认证。 demo 密码 SASL密码用于实例访问认证,请妥善管理密码,系统无法获取您设置的密码内容。 - 客户端证书 请采用.pem格式的客户端证书 - 单击“验证并保存自定义Kafka配置信息”,验证自定义Kafka实例连通性。
扩展名(.log、.trace和.out)限制;被采集日志文件必须为文本文件。 2019-8-30 容器指标增加对“文件系统可用”“文件系统容量”和“文件系统使用率”的支持。 主机和容器指标增加对NPU指标的支持。 2019-8-21 支持统计分析APP的用户运营数据,便于您更有针对性的开展运营活动。
行。 主机监控的设计类似应用监控,主机的层级关系为:主机列表->主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。 应用自动发现 您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,组件名称,容器名称,Kubernetes
在作业、标准化运维中定义的全局共享参数,支持字符串,主机列表类型。除了达到多步骤参数共享目的,可清晰的看到整个流程涉及的全部参数和用途。 OS账号 用于执行脚本和文件管理的操作系统账户。 工具市场 服务默认提供的按照场景分类展现各功能的工具卡片,用户可根据需要控制场景从服务市场中上下架和基于安全考虑配置任务的审批流程。
执行脚本任务失败,提示 :agent not found 问题现象 在ECS执行脚本任务时失败,系统提示“agent not found”。 可能原因 没有正确安装UniAgent。 UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态
新增变量 通过新增变量可在仪表盘页面查看或新增图表时,自定义添加过滤器。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“仪表盘”。 选择待操作的仪表盘,在对应“仪表盘”页面右上角单击,进入“变量设置”页面。 单击“新增变量”,参考表1设置相关参数。 表1 新增变量填写说明
该参数可以为空。 选填 business 应用英文名称,为全局概念。如果填写,则必须提前创建该应用。如果为空,则代表默认应用(开通APM时系统会自动创建一个默认应用)。 选填 subBusiness 子应用,为全局概念,在应用下面子文件夹。该参数可以为空,为空代表资源挂载在根应用下面,子应用最多支持三层。比如
算方式时,不支持使用告警恢复功能。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 默认只监控一个周期,最多可监控5个连续周期指标数据。 系统处理方式包括:超限阈值并发送告警、数据不足并发送事件、保持上一个状态、正常并发送清除告警。
日志管理使用说明 AOM支持容器服务日志和虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。 使用该功能前首先要配置日志采集路径,详情请参考配置日志采集路径。 图1 日志管理使用说明 父主题: 日志管理
ICAgent属于插件,UniAgent不属于插件,二者不是同一个含义。 UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(ICAgent、CES、telescope等)并维护其状态。UniAgent
个IAM用户被授予的策略中必须包含允许“aom:metric:get”的授权项,该接口才能调用成功。 支持的授权项 策略包含系统策略和自定义策略,如果系统策略不满足授权要求,管理员可以创建自定义策略,并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下:
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
批量操作UniAgent 在主机列表中,可批量对主机的UniAgent进行重装、升级、卸载和删除操作。 如果安装UniAgent的主机是Windows操作系统,则只支持对主机的UniAgent进行升级和删除操作,如需重装和卸载,需手动在主机上执行。 重装UniAgent 当主机的UniAgent
给用户组授权之前,请您了解用户组可以添加的AOM权限,并结合实际需求进行选择,AOM支持的系统权限,请参见AOM系统权限。若您需要对除AOM之外的其他服务授权,IAM支持服务的所有系统权限请参见系统权限。 示例流程 图1 给用户授权AOM权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予AOM只读权限“AOM
给用户组授权之前,请您了解用户组可以添加的AOM权限,并结合实际需求进行选择,AOM支持的系统权限,请参见AOM系统权限。若您需要对除AOM之外的其他服务授权,IAM支持服务的所有系统权限请参见系统权限。 示例流程 图1 给用户授权AOM权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予AOM只读权限“AOM
租户从IAM申请到的projectid,一般为32位字符串。 表4 EventModel 参数 参数类型 描述 id String 事件或者告警id,系统自动生成。 starts_at Long 事件或者告警产生的时间,CST毫秒级时间戳。 ends_at Long 事件或者告警清除的时间,CST毫秒级时间戳,为0时表示未删除。
主要监控用户通过应用资源管理功能统一管理的所有资源对象与应用,通过该应用监控可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。 入口为:“进程监控 > 应用监控” 主要监控通过应用发现规则发现的进程对应的应用。 父主题: 应用监控