检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
KuduTServer进程tablet数量超过阈值 告警解释 系统每60秒周期性检测Kudu的监控指标,当检测到KuduTServer进程tablet数量过高时,此时产生该告警。 KuduTServer进程tablet数量正常时,系统认为Kudu实例服务恢复,告警清除。 告警属性 告警ID
ALM-17003 Oozie服务不可用 告警解释 系统每5秒周期性检测Oozie服务状态,当Oozie或者Oozie所依赖的组件无法正常提供服务时,系统产生此告警。 当Oozie服务恢复可用状态时,告警自动消除。 告警属性 告警ID 告警级别 是否自动清除 17003 紧急 是
System.out.println("JavaHBaseBulkGetExample {tableName}"); return; } LoginUtil.loginWithUserKeytab(); String tableName = args[0];
println("JavaHBaseForEachPartitionExample {tableName} {columnFamily}"); return; } LoginUtil.loginWithUserKeytab(); final String tableName
+ " does not exist") all_the_text = open(file_path).read() return all_the_text def exec_sql(): # 提交前修改sql路径 # file_path = "/o
utExample " + "{tableName} {columnFamily}"); return; } LoginUtil.loginWithUserKeytab(); String tableName = args[0];
println("JavaHBaseBulkLoadExample {outputPath} {tableName}"); return; } LoginUtil.loginWithUserKeytab(); String outputPath =
IoTDB中数据以region分配在IoTDBServer上,region副本数默认是“3”,最终在IoTDBServer文件系统上表现为3个文件。上限为操作系统可存储文件个数最大值,对于Linux系统即是inode个数。 父主题: IoTDB运维管理
成 本章节仅适用于MRS 3.3.1及之后版本。 告警解释 系统每隔5分钟检测一次mutation任务,当检测到有正在执行的mutation任务且运行时间大于等于阈值slow_mutation_cost_time时,系统产生告警;当没有检测到正在运行的mutation任务或mut
RoleName 产生告警的角色名称。 HostName 产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。 对系统的影响 Yarn ResourceManager堆内存使用率过高,会影响Yarn任务提交和运行的性能,甚至造成内存溢出导致Yarn服务不可用。
ALM-45275 Ranger服务不可用 告警解释 告警模块按180秒周期检测Ranger服务状态,当检测到Ranger服务异常时,系统产生此告警。 当系统检测到Ranger服务恢复正常,且告警处理完成时,告警恢复。 告警属性 告警ID 告警级别 是否自动清除 45275 紧急 是 告警参数
提升HDFS写数据性能 操作场景 HDFS写数据性能直接影响整个系统的效率。提升写性能可以减少数据写入时间,加快数据处理流程,提高系统的整体响应速度。通过全面提升HDFS的写数据性能,可以使得HDFS集群更适应自身的业务情况,从而提升HDFS的写性能。 约束与限制 本章节适用于MRS
配置客户端NameNode黑名单功能 操作场景 在系统缺省场景中,一旦某进程中的一个NameNode发生故障,在同一进程中的所有HDFS客户端实例都会尝试再次连接NameNode,导致上层应用长时间等待超时。当位于同一JVM进程中的客户端对无法访问的NameNode进行连接时,会对系统造成负担。 为了避免以
ALM-26053 Storm Slot使用率超过阈值(2.x及以前版本) 告警解释 系统每60秒周期性检测Slot使用率,并把实际Slot使用率和阈值相比较。当检测到Slot使用率高于阈值时产生该告警。 用户可通过“系统设置 > 阈值配置”修改阈值。 当Slot使用率小于或等于阈值时,告警恢复。
配置完跨Manager集群互信后,需要在互信的系统上设置访问用户的权限,这样指定的用户才能在互信系统上进行对应的业务操作。 前提条件 已完成跨集群互信配置,然后刷新两个集群的客户端。 配置互信集群的用户权限(MRS 3.x及之后版本) 登录本端系统的Manager界面。 登录集群Mana
告警参数 参数名称 参数含义 来源 产生告警的集群或系统名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。 对系统的影响 可能造成主机上业务无法发起对外建立连接,业务中断。
ALM-14012 Journalnode数据不同步 告警解释 在主NameNode节点上,系统每5分钟检测一次集群中所有JournalNode节点的数据同步性。如果有JournalNode节点的数据不同步,系统产生该告警。 当Journalnode数据同步5分钟后,告警恢复。 告警属性 告警ID
usionInsight Manager创建恢复DBService与Kafka任务来恢复CDL业务数据。系统仅支持手动进行数据恢复。 只支持进行数据备份时的系统版本与当前系统版本一致时的数据恢复。 当业务正常时需要恢复数据,建议手动备份最新管理数据后,再执行恢复数据操作。否则会丢
TokenServer RPC队列平均时间超过阈值 告警解释 系统每30秒周期性检测TokenServer服务RPC队列平均时间,当连续5次检测到TokenServer实例RPC队列平均时间超出阈值时产生该告警。 当系统检测到TokenServer服务RPC队列平均时间小于阈值时,告警恢复。
在MRS Manager界面,单击“系统设置 > 日志导出”。 请联系运维人员,并发送已收集的故障日志信息。 告警清除 MRS 1.9.3.10及之后补丁版本:此告警修复后,系统会自动清除此告警,无需手工清除。 其他2.x及之前版本:此告警修复后,系统不会自动清除此告警,需手工清除。