搜索_华为云

YARN应用开发简介 - YARN开发指南（安全模式） - MapReduce服务 MRS

YARN应用开发简介简介 Yarn是一个分布式的资源管理系统，用于提高分布式的集群环境下的资源利用率，这些资源包括内存、IO、网络、磁盘等。其产生的原因是为了解决原MapReduce框架的不足。最初MapReduce的committer还可以周期性的在已有的代码上进行修改，可是

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > YARN开发指南（安全模式）
Storm应用开发简介 - MapReduce服务 MRS

Storm是一个分布式的、可靠的、容错的数据流处理系统。它会把工作任务委托给不同类型的组件，每个组件负责处理一项简单特定的任务。Storm的目标是提供对大数据流的实时处理，可以可靠地处理无限的数据流。 Storm有很多适用的场景：实时分析、在线机器学习、持续计算和分布式ETL等，易扩

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发概述
YARN应用开发简介 - YARN开发指南（普通模式） - MapReduce服务 MRS

YARN应用开发简介简介 Yarn是一个分布式的资源管理系统，用于提高分布式的集群环境下的资源利用率，这些资源包括内存、IO、网络、磁盘等。其产生的原因是为了解决原MapReduce框架的不足。最初MapReduce的committer还可以周期性的在已有的代码上进行修改，可是

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > YARN开发指南（普通模式）
YARN应用开发简介 - YARN开发指南（普通模式） - MapReduce服务 MRS

YARN应用开发简介简介 Yarn是一个分布式的资源管理系统，用于提高分布式的集群环境下的资源利用率，这些资源包括内存、IO、网络、磁盘等。其产生的原因是为了解决原MapReduce框架的不足。最初MapReduce的committer还可以周期性的在已有的代码上进行修改，可是

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > YARN开发指南（普通模式）
YARN应用开发简介 - YARN开发指南（安全模式） - MapReduce服务 MRS

YARN应用开发简介简介 Yarn是一个分布式的资源管理系统，用于提高分布式的集群环境下的资源利用率，这些资源包括内存、IO、网络、磁盘等。其产生的原因是为了解决原MapReduce框架的不足。最初MapReduce的committer还可以周期性的在已有的代码上进行修改，可是

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > YARN开发指南（安全模式）
Spark应用开发简介 - Spark2x开发指南（安全模式） - MapReduce服务 MRS

Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建，或从与Hadoop兼容的其他存储系统中输入创建。从父RDD转换得到新RDD。从数据集合转换而来，通过编码实现。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
Spark应用开发简介 - Spark2x开发指南（普通模式） - MapReduce服务 MRS

Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建，或从与Hadoop兼容的其他存储系统中输入创建。从父RDD转换得到新RDD。从数据集合转换而来，通过编码实现。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
Spark应用开发简介 - Spark2x开发指南（普通模式） - MapReduce服务 MRS

Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建，或从与Hadoop兼容的其他存储系统中输入创建。从父RDD转换得到新RDD。从数据集合转换而来，通过编码实现。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Spark应用开发简介 - Spark2x开发指南（安全模式） - MapReduce服务 MRS

Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建，或从与Hadoop兼容的其他存储系统中输入创建。从父RDD转换得到新RDD。从数据集合转换而来，通过编码实现。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
使用ZooKeeper客户端 - MapReduce服务 MRS

使用ZooKeeper客户端 Zookeeper是一个开源的，高可靠的，分布式一致性协调服务。Zookeeper设计目标是用来解决那些复杂，易出错的分布式系统难以保证数据一致性的。不必开发专门的协同应用，十分适合高可用服务保持数据一致性。背景信息在使用客户端前，除主管理节点以

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper
建立Hive表分区提升查询效率 - MapReduce服务 MRS

dynamic.partition.mode=nonstrict; 需注意：动态分区可能导致一个DML语句创建大量的分区，对应创建大量新文件夹，对系统性能可能带来影响。在文件数量大的情况下，执行一个SQL语句启动时间较长，可以在执行SQL语句之前执行“set mapreduce.input

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
删除ClickHouse表 - 开发ClickHouse应用 - MapReduce服务 MRS

clickhouse.examples包的“Demo”类的dropTable方法中。用于删除在创建ClickHouse表中创建的副本表和分布式表。 private void dropTable(String databaseName, String tableName, String

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（普通模式） > 开发ClickHouse应用
删除ClickHouse表 - 开发ClickHouse应用 - MapReduce服务 MRS

clickhouse.examples包的“Demo”类的dropTable方法中。用于删除在创建ClickHouse表中创建的副本表和分布式表。 private void dropTable(String databaseName, String tableName, String

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（安全模式） > 开发ClickHouse应用
Spark2x基本原理 - MapReduce服务 MRS

到的数据中恢复的优势。建议缓存RDD时不采取多备份选项，因为用于预写日志的容错文件系统很可能也复制了数据。在启用了预写日志以后，数据接收吞吐率会有降低。由于所有数据都被写入容错文件系统，文件系统的写入吞吐率和用于数据复制的网络带宽，可能就是潜在的瓶颈了。在此情况下，需要创建更多

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
EXPLAIN - MapReduce服务 MRS
EXPLAIN - MapReduce服务 MRS

JSON } TYPE { LOGICAL | DISTRIBUTED | VALIDATE | IO} 描述显示一条语句的逻辑的或者分布式的执行计划，也可以用于校验一条SQL语句，或者是分析IO。参数TYPE DISTRIBUTED用于显示分片后的计划（fragmented

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine辅助命令语法
Spark应用开发简介 - Spark应用开发概述 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
快速开发Spark应用 - MapReduce服务 MRS

快速开发Spark应用 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言的应用开发。通常适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
Presto - MapReduce服务 MRS
Presto - MapReduce服务 MRS

Presto允许查询的数据源包括Hadoop分布式文件系统（HDFS），Hive，HBase，Cassandra，关系数据库甚至专有数据存储。一个Presto查询可以组合不同数据源，执行跨数据源的数据分析。图1 Presto架构 Presto分布式地运行在一个集群中，包含一个Coord

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

方案架构 Kafka是一个分布式的、分区的、多副本的消息发布-订阅系统，它提供了类似于JMS的特性，但在设计上完全不同，它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性，适用于离线和在线的消息消费，如常规的消息收集、网站活性跟踪、聚合统计系统运营数据（监控数据）、日志收

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
Presto应用开发简介 - MapReduce服务 MRS

Presto应用开发简介 Presto简介 Presto是一种开源、分布式SQL查询引擎，用于对千兆字节至PB级大小的数据源进行交互式分析查询。 Presto主要特点如下：多数据源：Presto可以支持Mysql，Hive，JMX等多种Connector。支持SQL：Presto完全支持ANSI

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > Presto应用开发概述

总条数： 2811

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消