检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
登录MRS集群详情页面,选择“告警管理”。 选中“告警ID”为“43013”的告警,查看“定位信息”中的实例的IP地址及角色名。 单击“组件管理 > Spark > 实例 > JDBCServer(对应上报告警实例IP地址) > 定制 >JDBCServer的GC时间”。
如果对接了DataArts Studio服务,请检查DataArts Studio作业是否使用过期的用户密码, 如果使用请前往DataArts Studio管理中心修改密码后重新执行故障作业。 等待次日凌晨1点之后,观察告警是否自动清除。 是,操作结束。 否,执行步骤 5。
需要联系系统管理员扩大端口范围。
在Linux系统Hive客户端使用命令beeline。
以root用户登录主管理节点,用户密码为安装前用户自定义,请咨询系统管理员。管理节点的主备状态及对应IP地址可在FusionInsight Manager主机管理界面查看。 查看不健康服务的日志信息。
对系统的影响 系统无法提供数据加载,查询,提取服务。 可能原因 Hive服务不可用可能与ZooKeeper、HDFS、Yarn和DBService等基础服务有关,也可能由Hive自身的进程故障引起。 ZooKeeper服务异常。 HDFS服务异常。 Yarn服务异常。
根据实际服务的使用情况在“系统设置 > 阈值配置 > 设备 > 主机 > 网络读信息 > 网络读包率信息 > 读包丢包率”中更改告警阈值。 等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行步骤 17。 检查网络是否异常。 联系系统管理员,检查网络是否存在异常。
ifNotExists 如果设置为true, 当分区已经存在,系统报错。
Hive执行msck repair table命令时报错 现象描述 Hive执行msck repair table table_name命令报错: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask
产品功能 作业管理 元数据管理 企业项目管理 多租户资源管理 组件WebUI便捷访问 节点自定义引导操作 集群管理 集群运维 集群状态消息通知 MRS安全增强 MRS可靠性增强
单击“组件管理 > MapReduce > 服务配置 > 全部配置 > JobHistoryServer > 系统”。将GC_OPTS参数中-Xmx的值根据实际情况调大,并单击“保存配置”,勾选“重新启动角色实例。”,单击“确定”进行重启。 观察界面告警是否清除。
以root用户登录客户端所在节点,执行以下命令,检查“/user/oozie/share”路径是否存在,用户密码为安装前用户自定义,请咨询系统管理员。 如果集群采用安全版本,要进行安全认证。
以root用户登录告警所在节点,用户密码为安装前用户自定义,请咨询系统管理员。 集群节点登录可参考登录MRS集群节点。 执行命令查看haveged安装情况,观察命令返回结果是否为空。 /bin/rpm -qa | grep -w "haveged" 是,执行步骤 6。
登录MRS集群详情页面,选择“组件管理”。 选择“Storm > Supervisor”,进入Storm服务管理页面。 查看“角色”中是否存在状态为故障或者是正在恢复的Supervisor实例。 是,执行1.d。 否,执行2.a或者3.a。
创建一个Linux系统的弹性云服务器,对应ECS的安全组、虚拟私有云、子网需要和迁移目的端MRS集群保持一致,具体操作请参见自定义购买ECS。 还需根据实际环境打通该ECS与源端Doris集群的网络。
对接低版本的kudu(MRS 3.0.5)后,无法执行join,报错如下: Unable to open scanner for node with id '0' for Kudu table 'impala::xxx': Remote error: unsupported feature
图2 Configure 在“Project Defaults”页面中,选择“Project Structure”。 图3 Project Defaults 在打开的“Project Structure”页面中,选择“SDKs”,单击绿色加号添加JDK。
对于虚拟机环境,通过命令可能无法查询到网口速率,建议直接联系系统管理确认网口速率是否满足需求。 若网络读吞吐率超过阈值,直接联系系统管理员,提升网口速率。 检查该告警是否恢复。 是,处理完毕。 否,执行步骤 9 收集故障信息。
对于虚拟机环境,通过命令可能无法查询到网口速率,建议直接联系系统管理确认网口速率是否满足需求。 若网络写吞吐率超过阈值,直接联系系统管理员,提升网口速率。 检查该告警是否恢复。 是,处理完毕。 否,执行步骤 9 收集故障信息。
如果对接了DataArts Studio服务,请检查DataArts Studio作业是否使用即将过期的用户密码, 如果使用请前往DataArts Studio管理中心修改密码防止业务受到影响, 否则可能存在作业大规模失败风险。 等待次日凌晨1点之后,观察告警是否自动清除。