检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控配置监控及告警的全流程介绍 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态
IAM帐户权限异常该如何处理? 如果您需要使用主机监控功能,则用户组下子用户必须带有Security Administrator权限,若无Security Administrator权限会出现权限异常提示,请联系帐号管理员修改权限。 云监控服务提供系统策略及操作与策略权限一览表,请参见
如何获取Agent的Debug日志? 操作步骤 找到并且修改Agent日志配置文件,<ces>、<ces_new>如果都存在则都要修改,<ces>、<ces_new>如果只存在一个,可以只修改一个。 Linux: /usr/local/uniagent/extension/install
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型
如何配置DNS和安全组? 本章节指导用户为Linux系统的主机添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,其他主机步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保障用户的资源
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常
删除告警规则 功能介绍 删除一条告警规则。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI DELETE /V1.0/{project_id}/alarms/{alarm_id
手动配置Agent(Linux,可选) 操作场景 用户成功安装Agent插件后,推荐您采用“修复插件配置”方式配置Agent。如果修复插件配置不成功或其他原因,你可以采用本章节提供的手工方式配置Agent。 前提条件 已成功安装Agent插件。 确认正在使用的Agent版本 使用root
创建站点监控的告警通知 操作场景 本章节指导用户对已创建的站点进行告警规则的配置。 前提条件 已创建站点监控。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务 > 站点监控”。 单击监控站点所在行的“创建告警规则”。 在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示
站点监控简介 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 首期支持华北(廊坊)、华东(上海)、华南(广州)、西南(贵阳)、华南(深圳)五个探测点实时监控网站,后续探测点和能力不再演进,如有诉求请使用广域网质量监控,具体操作请参见广域网质量监控
站点监控 大量的商品类目、用户信息、交易数量、店铺展示信息,会导致不同用户访问网站速度变慢。可使用站点监控对网站的可用性进行监控,并且对类目、用户、交易、店铺等接口进行持续拨测,测试接口的可用性,判断业务系统是否正常。 本章节以www.example.com为例,创建站点监控,并为站点的可用性
Agent支持的系统有哪些? 以下列表中系统版本,是经过验证确定可以支持的系统版本,对于其余版本的支持情况,正在验证中。 以下系统都基于华为云IMS服务提供的公共镜像或者公共镜像创建的系统,如果使用未经验证的外部系统,可能会出现依赖问题或引入其他不稳定因素,请谨慎使用。 操作系统
创建资源分组 使用场景 针对使用多种云产品的用户,通过资源分组功能将同一业务相关的弹性云服务器、裸金属服务器、云硬盘、弹性IP、带宽、数据库等资源添加到同一资源分组中。从分组角度查管理资源,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 限制与约束 一个用户最多可创建1000
策略和授权项说明 如果您需要对您所拥有的Cloud Eye进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用Cloud
查询告警历史 功能介绍 根据告警ID查询告警历史。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{project_id}/alarm-histories
资源标签管理 查询CES指定项目指定资源类型标签列表 父主题: 云资源监控
批量删除告警规则资源 功能介绍 批量删除告警规则资源(资源分组类型的告警规则不支持),资源分组类型的修改请使用资源分组管理相关接口 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能
查询告警记录列表 功能介绍 查询告警记录列表 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/alarm-histories
创建/删除/复制/修改通知内容模板 创建通知模板 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警通知”,进入告警通知界面。 在“通知内容模板”页签,单击“创建通知内容模板”,根据界面提示配置参数。 根据界面提示,配置告警通知内容模板的基本信息。 图1 基本信息