搜索_华为云

在客户端安装节点的/tmp目录下残留了很多blockmgr-开头和spark-开头的目录 - MapReduce服务 MRS

dir被设置为/tmp，因此默认使用系统/tmp目录。但存在一些特殊情况，如driver进程未正常退出，比如被kill -9命令结束进程，或者Java虚拟机直接崩溃等场景，导致driver的退出流程未正常执行，则可能导致该部分目录无法被正常清理，残留在系统中。当前只有yarn-cli

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
准备连接Kafka集群配置文件 - MapReduce服务 MRS

作权限：选择“系统 > 权限 > 用户 > 添加用户”，在新增用户界面，创建一个机机用户，例如developuser，“用户组”需加入“kafkaadmin”用户组。单击“确定”。使用admin用户登录FusionInsight Manager，选择“系统 > 权限 > 用

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（安全模式） > 准备Kafka应用开发环境
配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

本不影响系统性能的前提下，最大程度地避免OOM情况的发生。配置描述提供两种不同的数据汇聚功能配置选项，两者在Spark JDBCServer服务端的tuning选项中进行设置，设置完后需要重启JDBCServer。登录FusionInsight Manager系统。详细操作请参考访问集群Manager。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
删除Hive on HBase表中的单行记录 - MapReduce服务 MRS

删除Hive on HBase表中的单行记录操作场景由于底层存储系统的原因，Hive并不能支持对单条表数据进行删除操作，但在Hive on HBase功能中，MRS Hive提供了对HBase表的单条数据的删除功能，通过特定的语法，Hive可以将自己对应的HBase表中符合条件的一条或者多条数据清除。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive on HBase
MRS集群内节点的sudo log能否清理？ - MapReduce服务 MRS

因为日志占用了一部分存储空间，建议管理员清除比较久远的操作日志释放资源空间。日志文件较大，可以将此文件目录添加到“/etc/logrotate.d/syslog”中，让系统做日志老化，定时清理久远的日志。更改文件日志目录：sed -i '3 a/var/log/sudo/sudo.log' /etc/logrotate

帮助中心 > MapReduce服务 MRS > 常见问题 > 节点管理类
备NameNode节点长时间未启动，导致启动失败 - MapReduce服务 MRS

/BigData/namenode/current”。 dfs.namenode.name.dir：表示DFS NameNode在本地文件系统存储fsimage的目录。如果设置为一个以逗号分隔的目录列表，那fsimage会复制到该列表中的所有目录以进行冗余备份。默认值为“${BI

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
ALM-12011 Manager主备节点同步数据异常 - MapReduce服务 MRS

是否自动清除 12011 紧急是告警参数参数名称参数含义来源产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响备Manager的配置文件没有更新。当发生主备倒换时，同步异常的配置文件可能会丢

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-13004 ZooKeeper堆内存使用率超过阈值 - MapReduce服务 MRS

产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 ZooKeeper可用内存不足，可能会造成内存溢出导致服务崩溃，可能导致上游组件（例如Yarn、Flink、Spark等）业务运行失败。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14030 HDFS已开启允许写入单副本数据 - MapReduce服务 MRS

服务名产生告警的服务名称。角色名产生告警的角色名称。对系统的影响如果服务端打开了HDFS允许写入单副本数据开关，当客户端HDFS配置的副本数为1，则会有单副本数据写入HDFS。单副本数据会存在数据丢失风险，故系统默认不允许写入单副本数据。如果业务需要某个目录写单副本数据，请修改HDFS配置项“dfs

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-16003 Background线程使用率超过阈值 - MapReduce服务 MRS

产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响后台Background线程数过多，导致新提交的任务无法及时运行。可能原因 Hive后台的background线程池使用率过大。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-16053 Hive的HQL最近5分钟平均提交时间超过阈值 - MapReduce服务 MRS

产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名称。附加信息 Trigger condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响发生当前告警时，表示最近5分钟HQL的平均提交时间超过阈值，会导致HQL运行时间变长。对于Hive On Spark作业，可能会导致作业报错。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19013 region处在RIT状态的时长超过阈值 - MapReduce服务 MRS

ALM-19013 region处在RIT状态的时长超过阈值告警解释系统按300秒周期性检测HBase上的region处在RIT状态的数量。当检测到处在RIT状态的region时长超过阈值时长（连续两次超过阈值），上报该告警。当处在超时状态的region都恢复后，告警恢复。告警属性

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19030 RegionServer的RPC请求处理时间的P99超过阈值 - MapReduce服务 MRS

ALM-19030 RegionServer的RPC请求处理时间的P99超过阈值告警解释系统每30秒周期性检测每个HBase服务的RegionServer实例的RPC请求处理时间的P99，当检测到某个RegionServer上的RPC请求处理时间的P99连续10次超出阈值时产生该告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19033 RegionServer的RPC读队列数超过阈值 - MapReduce服务 MRS

ALM-19033 RegionServer的RPC读队列数超过阈值告警解释系统每30秒周期性检测每个HBase服务的RegionServer实例的RPC读队列待处理任务个数，当检测到某个RegionServer上的RPC读队列待处理任务个数连续10次超出阈值时产生该告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38006 Kafka未完全同步的Partition百分比超过阈值 - MapReduce服务 MRS

产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 Kafka服务未完全同步的Partition数过多，会影响服务的可靠性，一旦发生leader切换，可能会导致丢数据。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45003 HetuEngine QAS磁盘容量不足 - MapReduce服务 MRS

产生告警的角色名称。主机名产生告警的主机名。设备分区名产生告警的磁盘分区。 Trigger Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响磁盘容量不足会导致HetuEngine QAS写入数据失败，影响HetuEngine服务SQL运维的SQL诊断和自动物化视图推荐功能。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45433 ClickHouse AZ拓扑检查异常 - MapReduce服务 MRS

该告警。当系统检测到所有shard的实例满足跨AZ高可用部署，告警自动清除。告警属性告警ID 告警级别是否自动清除 45433 紧急是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。主机名产生告警的主机名。对系统的影响 Cl

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45478 Kudu组件数据均衡失败 - MapReduce服务 MRS

ALM-45478 Kudu组件数据均衡失败告警解释系统周期性对Kudu组件的数据表进行数据均衡，当检测到数据均衡的接口返回失败，则产生此告警。当调用Kudu组件的数据均衡接口成功后，告警清除。告警属性告警ID 告警级别是否自动清除 45478 重要是告警参数类别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45589 ConfigNode堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-45589 ConfigNode堆内存使用率超过阈值告警解释系统每60秒周期性检测ConfigNode进程堆内存使用状态，当检测到ConfigNode进程堆内存使用率超出阈值（最大内存的90%）时产生该告警。当ConfigNode进程堆内存使用率小于阈值时，告警清除。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45640 FlinkServer主备节点间心跳中断 - MapReduce服务 MRS

跳消息后，系统产生告警。当心跳恢复后，告警恢复。告警属性告警ID 告警级别是否自动清除 45640 次要是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响 F

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 2749

上一页
1
...
80
81
82
...
138
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消