搜索_华为云

HDFS与其他组件的关系 - MapReduce服务 MRS

利用Hadoop HDFS作为其文件存储系统。HBase位于结构化存储层，Hadoop HDFS为HBase提供了高可靠性的底层存储支持。除了HBase产生的一些日志文件，HBase中的所有数据文件都可以存储在Hadoop HDFS文件系统上。 HDFS和MapReduce的关系

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
Spark应用开发常用概念 - MapReduce服务 MRS

Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建，或从与Hadoop兼容的其他存储系统中输入创建。从父RDD转换得到新RDD。从数据集合转换而来，通过编码实现。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
快速开发HDFS应用 - MapReduce服务 MRS

HDFS（Hadoop Distribute FileSystem）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，非常适合大规模数据集应用。 HDFS适用于如下场景：处理海量数据（TB或PB级别以上）需要很高的吞吐量需要高可靠性需要很好的可扩展能力

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
身份认证与访问控制 - MapReduce服务 MRS

身份认证与访问控制身份认证 MRS支持安全协议Kerberos，使用LDAP作为账户管理系统，并通过Kerberos服务对账户信息进行安全认证。 Kerberos安全认证原理和认证机制具体介绍请参见安全认证原理和认证机制。访问控制 MRS提供两种访问控制权限模型：基于角色的权

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

通过Flume采集指定目录日志系统文件至HDFS 应用场景 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
ClickHouse容量规划设计 - MapReduce服务 MRS

ClickHouse容量规划设计为了能够更好的发挥ClickHouse分布式查询能力，在集群规划阶段需要合理设计集群数据分布存储。当前ClickHouse能力为单机磁盘容量达到80%后会上报告警信息，磁盘容量达90%后集群会处于只读状态。出现磁盘告警信息后需要考虑是否是容量

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse集群规划
ALM-45436 ClickHouse表数据倾斜 - MapReduce服务 MRS

ALM-45436 ClickHouse表数据倾斜告警解释 ClickHouse各节点之间，分布式表对应的本地表中，若存在数据倾斜，系统产生此告警。当检测到数据均衡时，告警自动清除。数据倾斜检测方法：当参数“min_table_check_data_bytes”值为“0”时，不启用数据倾斜检查。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
运行HadoopStream作业 - MapReduce服务 MRS

脚本语言编写分布式计算作业，尤其适合快速原型开发和跨语言集成。用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个HadoopStream作业。前提条件用户已经将作业所需的程序包和数据文件上传至OBS或HDFS文件系统中。如果作

 帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 在MRS集群中提交作业
Yarn与其他组件的关系 - MapReduce服务 MRS

的资源管理系统，而ApplicationMaster则负责MapReduce作业的数据切分、任务划分、资源申请和任务调度与容错等工作。 Yarn和ZooKeeper的关系 ZooKeeper与Yarn的关系如图3所示。图3 ZooKeeper与Yarn的关系在系统启动时，Re

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
Kafka样例程序开发思路 - 开发Kafka应用 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上用户可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式） > 开发Kafka应用
Kafka样例程序开发思路 - 开发Kafka应用 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上用户可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式） > 开发Kafka应用
ALM-45428 ClickHouse磁盘IO异常 - MapReduce服务 MRS

或者EROFS错误，系统产生此告警。告警属性告警ID 告警级别是否自动清除 45428 重要（默认级别）否告警参数参数名称参数含义来源产生告警的集群名称服务名产生告警的服务名称角色名产生告警的角色名称主机名产生告警的主机名对系统的影响 ClickH

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Kafka样例程序开发思路 - 开发Kafka应用 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外，还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Kafka开发指南 > 开发Kafka应用
Kafka样例程序开发思路 - 开发Kafka应用 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上您可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式） > 开发Kafka应用
Kafka样例程序开发思路 - 开发Kafka应用 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上用户可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（安全模式） > 开发Kafka应用
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

OBS”，登录OBS控制台，单击“并行文件系统 > 创建并行文件系统”，填写以下参数，单击“立即创建”。表4 并行文件系统参数参数名称参数说明取值样例区域设置并行文件系统的区域。华北-北京四文件系统名称设置并行文件系统的名称 hiveobs 数据冗余存储策略多

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
快速创建和使用启用安全认证的MRS集群 - MapReduce服务 MRS

用于统计海量文本的单词数量。 Hadoop集群完全使用开源Hadoop生态，采用Yarn管理集群资源，提供Hive、Spark离线大规模分布式数据存储和计算及进行海量数据分析与查询的能力。操作流程开始使用如下样例前，请务必按准备工作指导完成必要操作。创建MRS集群：创建一个MRS

帮助中心 > MapReduce服务 MRS > 快速入门
Flume日志采集概述 - MapReduce服务 MRS

Flume日志采集概述 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
MRS可靠性增强 - MapReduce服务 MRS

的可靠性、性能调优等方面进行了优化和提升。系统可靠性管理节点均实现HA Hadoop开源版本的数据、计算节点已经是按照分布式系统进行设计的，单节点故障不影响系统整体运行；而以集中模式运作的管理节点可能出现的单点故障，就成为整个系统可靠性的短板。 MRS对所有业务组件的管理节点

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

用于统计海量文本的单词数量。 Hadoop集群完全使用开源Hadoop生态，采用Yarn管理集群资源，提供Hive、Spark离线大规模分布式数据存储和计算及进行海量数据分析与查询的能力。操作流程开始使用如下样例前，请务必按准备工作指导完成必要操作。创建MRS集群：创建一个MRS

帮助中心 > MapReduce服务 MRS > 快速入门

总条数： 2811

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消